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前 吉 


在 当今 信息 时 代 , 统 计 知识 得 到 越 来 越 多 的 应 用 ,各 种 统计 方法 层 出 不 
穷 . 在 统计 领域 中 ,统计 计算 技术 应 运 而 生 ,而 且 发 展 非常 迅速 。 它 一 方面 使 
得 许多 统计 方法 得 到 广泛 应 用 , 另 一 方面 使 得 有 些 难 以 在 理论 上 进行 论证 的 
问题 通过 模拟 得 到 证 实 . 

2005 年 以 前 ,我国 出 版 的 有 关 统 计 模 拟 的 著作 还 比较 少 ,一 般 只 是 在 理 
论 上 对 统计 计算 方法 进行 介绍 ,而 且 使 用 R 软件 给 出 具体 计算 程序 的 更 少 。 
然而 不 过 四 五 年 ,有 关 统 计 模 拟 和 对 R 软件 使 用 进行 介绍 的 书籍 开始 大 量 出 
版 . 而 我 们 适时 出 版 这 部 书 ,也 正 是 适应 时 代 的 需要 . 同时 ,本 书 也 是 省 级 教改 
项 目 “ 适 应 新 时 期 人 才 培 养 的 需要 ,构建 概率 统计 类 课程 体系 ”和 校 级 研究 生 
创新 工程 项 目 “ 基 于 复杂 数据 的 统计 计算 与 模拟 ”的 一 项 研究 成 果 . 提高 大 学 
生 以 及 研究 生 进行 数据 挖 扎 建立 统计 模型 的 能 力 是 本 项 目 改革 的 重点 . 因 
此 ,本 书 在 写作 上 特别 注意 以 下 6 个 显著 的 特点 : 

(1) 统 计 计算 方法 全 面 , 脉 络 分 明 :分 别 介绍 了 逆 变 量 法 、 筛 选 法 、 条 件 期 
望 法 、 分 层 抽样 法 、 重 要 抽样 法 、EM 算法 .MCMC 法 等 . 既 考 虑 了 离散 型 随机 
变量 的 模拟 ,又 考虑 了 连续 型 随机 变量 的 模拟 ,同时 还 考虑 了 随机 过 程 的 模 
拟 .不 仅 考虑 了 一 维 随机 变量 的 模拟 ,而 且 考 虑 多 维 随机 向 量 的 模拟 . 

(2) 统 计 计 算 方法 细腻 详实 ,所 编写 的 程序 可 以 通过 跟踪 验证 其 准确 性 . 

(3) 密 切 结合 实际 问题 ,例如 经 济 中 的 期 权 策略 实施 、 维 修 问 题 、 排 队 问 
题 等 . 

(4) 每 章 内 容 由 浅 人 和 人 深 , 浅 显 易 懂 ,但 又 能 给 人 以 更 多 的 启示 . 同时 还 配 
有 若干 练习 ,帮助 读者 加 强 理解 与 巩固 相关 的 知识 . 

(5) 本 书 第 六 章 每 提出 一 个 模拟 方法 ,都 要 和 其 他 的 方法 相 比较 , 尽 量 使 
算法 更 有 效 . 通 篇 构成 一 个 有 机 的 整体 ,读者 阅读 此 书 ,会 感到 逻辑 性 强 ,问题 
提出 的 背景 清晰 . 

(6) 本 书 运 用 R 语言 将 许多 例子 进行 了 编程 ,以 供 读者 借鉴 ,使 读者 感觉 
有 种 工具 在 手 的 感觉 ,可 以 增强 自信 心 ,克服 旦 难 心理 . 

本 书 的 内 容 和 练习 取 含 了 Sheldon M. Ross 的 Simulation 一 书 的 内 容 和 练 
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习 ,R 软件 的 介绍 借鉴 了 李 东 风 的 《统计 软件 教程 》, 在 此 表示 衷心 的 感谢 . 本 
书 的 出 版 得 到 了 武汉 大 学 出 版 社 、 华 中 农业 大 学 教务 处 和 研究 生 处 的 大 力 支 
持 ,在 此 表示 衷心 的 感谢 ! 本 书 适合 大 、 中 专 院 校 从 事 统 计 或 计算 机 方面 的 工 
作 或 学 习 的 教师 和 本 科 生 、 研 究 生 阅读 . 章节 的 安排 .内 容 的 组 织 以 及 程序 的 
编写 ,都 是 由 肖 枝 洪 和 朱 强 两 人 共同 商检 而 定 .虽然 我 们 在 编写 的 过 程 中 作 了 
很 大 努力 ,力求 准确 ,但 是 由 于 水 平 有 限 ,所 著 之 书 可 能 存在 许多 错误 , 散 请 读 
者 批评 指正 . 


编 者 
2010 年 1 月 于 狮子 山 
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~ 第 且 章 
预 和 省 知识 


我 们 设想 读者 已 经 具备 了 初等 概率 统计 的 基础 知识 ,因此 本 章 仅 对 初等 
概率 统计 中 介绍 得 较 少 而 在 本 书 以 后 有 关 章 节 所 需要 的 内 容 进 行 介绍 . 


1.1 短 母 函数 与 生成 函数 


有 时 直接 求 若 干 独立 随机 变量 和 的 分 布 很 不 方便 ,下 面 引 进 矩 母 函 数 和 
生成 函数 来 解决 此 问题 . 矩 母 函 数 和 生成 函数 在 第 六 章 介绍 重要 抽样 法 时 也 
会 用 到 . 

定义 1.1 设 随 机 变量 不 的 密度 函数 为 pP(x) , 称 E[exp(!) ] 为 下 的 矩 
母 函 数 , 记 为 gx(1) , 或 简 记 为 g(t), 即 - 


g(t) = Elexp(1X)] = |exp(tz)P(z) dx 


注 : 矩 母 函数 g(+) 与 忒 的 分 布 函数 相互 唯一 确定 ,通过 和 矩 母 函 数 可 计算 
马 的 各 阶 矩 : 
E[X"] =& (0), 
式 中 , g(t) 指 函 数 g(1) 关于 1 的 n 阶 导数 .车 随机 变量 与 Y 相 互 独立 , 则 
Brrr(t) = gx(t) gy(t). 
我 们 将 一 些 常用 分 布 的 矩 母 函 数列 表 如 表 1-1. 


表 1-1 一 些 常用 分 布 的 矩 母 函数 











统计 模拟 及 其 及 实现 * 





续 表 











1 
N(p,0’) exp(pt + F300) 


Gamma(a,A) 


注 :Xx(n) 实质 上 为 Gamma( 二 ,二 ) 


定义 1.2 若 人 为 离散 型 随机 变量 , 称 E(s”) 为 其 概率 生成 函数 , 记 为 
gx(s), 或 简 记 为 $(s). 若 PIX = 上 |} =p.,k =0,1,2,.…, 则 


bx(s) = prs 


易 知 
Po =Px(0); 


1 dad’* 
ps = rs) | k=1,2,.. 


注 : 生 成 函数 $(s) 与 X 的 分 布 函数 相互 唯一 确定 .通过 生成 函数 可 计算 
下 的 各 阶 矩 . 例如 : 
E[X] =$"(1), E[X]=$"(1) + 由 (1). 
若 随机 变量 工 与 了 相互 独立 , 则 $x,y(s) = 中 x(s)g$y(s). 我 们 将 一 些 常用 分 布 
的 生成 函数 列表 如 表 1-2。 


表 1-2 一 些 常用 分 布 的 生成 函数 






概率 函数 
P(z) = 六 (1 ~p)' ,x = 0,1 
p(x) 二 C.p (1 Sp) YY ns 9015 二 








1l1+(s-1)p 


CV 





二 项 分 布 B(n,p) 












几何 分 布 C(p) p(x) = p(1 -p)*,% = 0,1, 


p 
1-s(l1-p) 





Poisson 分 布 P(A 和 A) 
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1.2 条 件 期 望 和 条 件 方 差 


1. 条 件 分 布 
如 果 式 和 了 是 离散 型 随机 变量 , 且 PIX=x,Y =y|} 为 人 和 YY 的 联合 概率 
函数 , 则 可 以 计算 在 已 知 碟 =zx 的 条 件 下 了 的 条 件 分 布 , 即 若 开 的 边缘 概率 函 


数 px(x) > 0, 则 条 件 概 率 函 数 PIY=y|X=x| = 人 = 


te 如 果 处 和 
Y 是 连续 型 随机 变量 , 且 p(x,y) 为 和 Y 了 的 联合 分 布 密度 函数 , 则 可 以 计算 
在 已 知 了 =x 的 条 件 下 了 Y 的 条 件 分 布 密度 函数 , 即 若 X 的 边缘 密度 函数 
px(%) > 0, 则 条 件 分 布 密度 函数 为 : 


_P(%,7) 
px(%) | 


【 例 1.1】 令 工 和 了 的 联合 密度 函数 如 下 : 


p(y|x) 


ey, O07<1,0<y<), 
en = 0， 理 则 . 
3 ly-l 
试 求 P{ < 地 17= 却 } 的 值 
解 易 知 Pi(7) = 了 + 广 , 故 
(Hy) xX+y 
p(x [7) = = 二， 
pr(7) 六 这 是: 
所 以 ， 
X 十 





| 


2. 条 件数 学 期 望 
由 于 条 件数 学 期 望 在 统计 模拟 中 有 着 重要 的 地 位 ,我 们 在 此 给 出 其 定义 . 
如 果 了 对 和 Y 是 具有 联合 概率 函数 的 离散 随机 变量 , 则 在 给 定 X=x 的 条 件 
下 了 的 条 件 期 望 E[Y|X=x] 为 
D7rPIX=x,Y=Y| 
E[Y|X=x] = DyPIY=y|X=x) = 一 PTX i 


人 
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即 ,给 定 忆 =x 的 条 件 下 了 的 条 件 期 望 是 以 给 定 艺 =x 的 条 件 下 了 取 值 y 的 条 
件 概率 为 权 的 加 权 平 均值 . 

类 人 地 ,如 果 式 和 了 是 具有 联合 密度 函数 败 x,y) 的 连续 随机 变量 , 则 在 
给 定 X=x 的 条 件 下 Y 的 条 件 期 望 ELY|X =x] 为 


[rz,7)ay 
[eR 


由 定义 知 E[Y|X] 为 X 的 函数 , 且 这 个 函数 在 X= x 时 取 值 为 E[Y|X = x]. 
同时 E[Y|X] 它 自身 也 是 一 个 随机 变量 . 下 述 性 质 是 非常 有 用 的 . 
命题 1.1 


E[Y|X=x] = 


E[E[Y|X]]=E[Y]. (1.2.1) 
如 果 天 是 一 个 离散 型 随机 变量 , 则 方程 (1.2.1) 可 化 为 
E[Y] = DE[Y|X=x]JPIX=x}; 
而 如 果 式 是 一 个 具有 密度 函数 g 的 连续 型 随机 变量 , 则 方程 (1.2.1) 可 化 为 
E[Y] = [ELY|X = 了 ]8(z)dx 
我 们 在 了 和 了 是 离散 型 随机 变量 情形 下 给 出 命题 1.1 的 证 明 . 
证 DEL[Y|IX=x]PIX=%}= > DrPlY=y|X=xlPIX=x|} 
= 5 SyPlX=r,Y=y) 
= D7rDPIX=x,Y=y| 
= > 7yPIY=7y| 


= ELY]. 
【 例 1.2】 随机 变量 (X,Y) 的 联合 分 布 律 如 下 表 : 














第 1 章 预备 知识 * 


试 求 8[X |Y] 的 分 布 律 3 EX 及 E(E[X|Y]). 
解 当 Y=1 时 ,有 
Plx=1|Y=1| -让 =， 


同 理 , PIX=2|Y=1| = 二 ;PI =31Y= 届 = 工 故 


a 
了 
3 


E[XIY=1]= Yiplx=ilY=1| = 上 


类 似 地 有 


3 
; : 28 
BIR | Ys2] = 让 pe 


E[X|Y=3] = | = 地 


又 PIE[X|Y] =E[XIY= 站 | =PIY= 放 y=1,2,3. 故 E[X|Y] 的 分 布 律 如 
Fe 


| 11 
E[X|Y=j] 3 





PIE[X|Y] =E[X|Y=/j]| =P{Y =j| 7 B53 5 


13 7 .28 :13 11. 5 .52 
BELXIY)S Mt 


而 
开放 : 8 13 6 52 
EA SPI Sl 
即 
、 52 
EX =E(E[X|Y])=;7: 
3. 条 件 方差 


给 定 了 =zx 的 条 件 下 了 的 条 件 方差 如 下 : 
Var(Y|X)= E[(Y - ELY|X])’ |X]. 
同样 , Var( 了 | X) 也 是 X 的 函数 , 且 这 个 函数 在 X= x 时 取 值 为 Var( 了 | 和 = x). 化 
简 得 到 
Var(Y|X)=E[Y |X] - (EL[Y|X))’. 
对 上 式 两 边 同 时 取 期 望 得 到 : 
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ELVar(Y|X)]=ELELY |X]] - EL(ELY|X])"] 


=E[Y] -EL[L(E[Y|X])’]. ( 辟 2.2) 
又 因为 E[(E[Y|X])] = ELY], 我 们 有 
Var(E[Y|X])=E[(E[Y|X])’] - (ELY])”. (1.2.3) 


将 式 (1.2.2) 与 式 (1.2.3) 相 加 得 到 下 面 的 等 式 一 一 著名 的 条 件 方差 公式 : 
Var(Y) = E[Var(Y |X)] + Var(E[Y|X]). 

【 例 1.3】 从 某 大 学 中 任意 挑选 一 个 学 院 , 然 后 从 此 学 院 任意 挑选 个 
学 生 . 令 七 表 示 这 些 学 生 中 来 自 武汉 市 的 人 数 . 令 @ 表示 该 学 院 来 自 于 武汉 
市 人 数 所 占 的 比例 ,因为 学 院 之 间 比 例 不 同 ,所 以 @ 也 为 随机 变量 . 给 定 
Q =g, 则 X ~B(n,g), 从而, E[X|Q=g] =ng,Var(X|1Q=9q)=ng(1-9). 
假设 随机 变量 Q ~ U0(0,1), 上 述 方式 建立 的 模型 称 为 分 层 模 型 , 记 为 

© ~ U(0,1), 
XIQ=4¢ ~ B(n,g). 


则 
E[X] = EE[X|Q] = E[nQ] = 元 ， 
Var(X)= E[Var(X|0)] +Var(E[X|0]) 
=E[nQ(1 - 0)] + Vai(ng) = 对 + 下 
1.3 随机 过 程 简 介 


以 前 我 们 学 过 的 概率 统计 中 随机 变量 序列 基本 上 是 独立 同 分 布 的 . 本 书 
中 还 将 考虑 相依 的 随机 变量 序列 . 例如 ,日 气温 将 形成 以 时 间 为 序 的 随机 变量 
序列 ,而且 一 天 的 气温 明显 地 与 前 一 天 的 气温 不 是 独立 的 . 

随机 过 程 {X,,: e 7} 是 一 个 随机 变量 集合 ,状态 空间 $ 是 随机 变量 X, 取 
值 的 集合 ,集合 7 称 为 指标 集 ,指标 集 可 以 是 离散 的 ,例如 7 = 10,1;2,…,} ， 
也 可 以 是 连续 的 ,例如 7=[0,w ), 这 取决 于 应 用 的 需要 . 对 于 指标 集 7 为 离 
散 情形 时 的 随机 过 程 有 时 也 称 为 随机 变量 序列 . 

【 例 1.4】 (天 气 变化 问题 ) 令 状态 集 S= | 晴 , 多 云 ] ,指标 集 7= 10， 
1,…| ,一 个 典型 的 序列 为 

晴 , 晴 ,多 云 , 多 云 , 晴 ,…. 
将 上 述 序 列 用 X, 依 次 记录 下 来 , 则 {X,,t e T| 就 是 一 个 具有 离散 的 状态 空间 
5 和 离散 的 指标 集 7 的 随机 过 程 . 
6 
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下 面 , 我 们 将 讨论 一 类 常用 的 随机 过 程 . 
1. Poisson 过 程 


假设 事件 在 [0,:] 上 任意 时 刻 发 生 且 令 N(t) 表示 在 时 间 [0,t] 上 事件 
发 生 的 个 数 . 如 果 

(1) N(0)=0; 

(2) N(5 是 独立 增 量 过 程 , 即 任 取 0 <t <t <… <i， 

N21),N(t) -六 三) VC) -人 CS) 

相互 独立 ; 

(3) 对 任何 上 > 0,s = 0, 增 量 N(s +1) - N(s) 服从 参数 为 At 的 Poisson 
分 布 , 即 


PIN(s +1) - N(s)=&| = 


则 称 这 些 事 件 构 成 一 个 具有 速率 和 A(A > 0) 的 Poisson 过 程 . 

条 件 (1) 描 述 了 过 程 开始 于 时 刻 0. 条 件 (2) ,这 个 独立 增 量 假设 阐述 了 
到 时 刻 : 发生 的 事件 数 ( N(1) ) 与 在 时 刻 t 和 :+s 之 间 发 生 的 事件 数 ( N(i+ 
s) - N(1) ) 相 互 独立 . 条件 (3) ,这 个 平稳 增 量 假设 前述 了 Nt+s) -NN(t) 的 
概率 分 布 对 任何 上 都 是 相同 的 ; 

对 于 一 个 Poisson 过 程 , 令 Zi 表示 第 一 个 事件 来 到 的 时 刻 . 进而 对 n > 1， 
令 X, 表示 第 n - 1 个 事件 和 第 ”个 事件 之 间 的 间隔 时 间 . 序列 {|X,,n = 1， 
2,… 二 称 为 间隔 时 间 序 列 . 例如 ,如 果 XY =1,X, =4, 则 Poisson 过 程 的 第 一 个 
事件 将 发 生 在 时 刻 1 和 第 二 个 事件 将 发 生 在 时 刻 4 之 间 ( 如 图 1-1). 


2 3 -Dt 上 
n 


图 1-1 间隔 时 间 


现在 我 们 来 确定 不, 的 分 布 .首先 注意 到 事件 |X，> 中 发 生 当 且 仅 当 
Poisson 过 程 在 区 间 [0,:] 上 没有 一 个 事件 发 生 , 从 而 

PIX, > tt} =P{N(G)= 0F =e™. 
因此 X 是 均值 为 二 的 指数 分 布 . 为 了 获得 区 的 分 布 ,注意 到 


PIX, >1 =s=PI 在 (ss+ 纪 上 没有 事件 发 生 | 闷 = ;| 
= Pl 在 (s,s + 1] 上 没有 事件 发 生 } 


一 人 
二 @ w 
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其 中 最 后 的 两 个 方程 成 立 是 因为 独立 增 量 性 . 由 前 述 讨论 知 , X, 也 是 均值 为 
二 的 指数 随机 变量 ,进而 X, 和 XX, 相互 独立 . 重复 这 样 的 讨论 ,我 们 得 到 命题 
1.2. 

命题 1.2 设 X,,X,,… 为 Poisson 过 程 中 事件 发 生 的 间隔 时 间 序 列 , 则 
Xi ,X,,… 是 独立 同 分 布 的 随机 变量 序列 , 且 共 同 分 布 为 具有 参数 A 的 指数 分 
布 . 

令 5. = 允 久 表示 第 个 事件 发 生 的 时 刻 .根据 事实 : 5. 不 大 于 + 当 且 仅 
当 到 时 间 :时 至 少 有 nn 个 事件 发 生 ,我 们 看 到 

PIS i spIN nl = Ss 


易 知 上 式 左边 是 5, 的 分 布 函 数 . 对 它 进行 微分 得 到 5, 的 密度 函数 p,(t) 如 
下 : 


A ee 
p(t)= Xe 7 jj 





a A RN 
rr 高科 :本 


(At" 
(n-1)! 


定理 1.1 设 1N(i),t 宇 0| 是 参数 为 A 的 Poisson 过 程 , 则 在 给 定 N(t)= n 
的 条 件 下 ,事件 的 到 达 时 刻 (5S, ,5S,,… ,5,) 的 联合 分 布 密度 为 


ni 
flsiss2 ss | NOt) = 1) = 0 < si < sy 访 “aew 贡 Sn 到 了 记 


ie Ae™ 


(1.3.1) 
证 明 ”给 定 N(t) =n, 设 n 个 事件 的 到 达 时 刻 分 别 为 (5, ,5,,… ,5,). 对 
充分 小 的 增 量 As,,i=1,2,…,n, 事件 N(t)=n 和 在 [s,s; +As,),i=1,2,…， 
n 中 恰 发 生 一 起 事件 而 在 [0 ) ,fs + Asiss3) ,Es + As ys) [ss + 
As,,t] 中 没有 事件 发 生 等 价 . 
ss VC) = n)AsiAs,…As, 
=Pls, < 5S, < s+As,i=1,2,.,n|N(t) =n} +o(AsAs,…As,) 
Pls, <S, <s+As,i=1,2,.…,n,N(t)=n! 
TOs (生动 
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Plss<S, <s,+As,i=1,2,.,n,N(t)=n| 
=P{N(s, + As,) - N(s) = 1,i=1,2,.,n, 

N(s1)=0,N(s,) - N(s, + Asi)=0,…, 

N(s,) -Ni + As,1)=0,N(t) - N(s, + As,)=0} 
=AAsie *"...AAs ev 。 
Ae -A211 An) ,, 


e ACnsn- lA) A InAs) 


+ o(AsiAs;*…As,) 
=A"Asi4s Ase +o(AsiAs,…As, ). (1533) 
将 (1.3.3) 代 入 (1.3.2) ,然后 除 以 olAsiAss…As,) 并 取 极 限 就 得 到 (1. 3. 
1 记 辣 
注 : 式 (1.3.1) 为 n 个 (0,1) 上 的 均匀 随机 变量 的 次 序 统计 量 的 密度 函 
数 .另外 ,定理 1.1 将 是 模拟 Poisson 过 程 的 理论 依据 . 
定义 1.3 如果 一 个 随机 变量 有 如 下 的 概率 密度 函数 : 


_ De (Ab" 
7(D = he Ta， 


就 称 之 为 具有 参数 (n,A) 的 Gamma 随机 变量 , 记 为 Gamma (n,A) 或 T(n， 
入 ). 

从 而 我 们 看 到 5, 一 一 具有 速率 入 的 Poisson 过 程 的 第 n 个 事件 发 生 的 时 
刻 , 是 一 个 具有 参数 (n,A) 的 工 随 机 变量 . 由 命题 1.2 立即 得 到 下 述 推论 . 

推论 1.1 nn 个 独立 同 分 布 的 指数 (参数 为 A ) 随机 变量 的 和 是 参数 为 
(n,A) 的 Gamma 随机 变量 . 

【 例 1.5】 顾客 依 Poisson 过 程 到 达 某 商店 ,速率 为 A = 4 人 /小 时 .已 知 
商店 上 午 9:00 开门 . 试 求 :到 9:30 时 仅 到 一 位 顾客 ,而 到 11:30 时 总 计 已 到 
达 5 位 顾客 的 概率 . 

解 设 1=0 表 示 上 午 9:00, N(i) 表示 [0,t] 内 商店 到 达 顾 客 数 , 依 题 意 
所 求 的 概率 为 

PIN(0.5)- N(0)= 1,N(2.5) -N(0.5)=4| 
= P|N(0.5) - N(0) = 1|PIN(2.5) - N(0.5) =4| 


_ (#4 x0.5) 7e (4 x 2)'e™”? 
11 41 


= 0.0155. 

2. 非 齐 次 Poisson 过 程 
齐 次 Poisson 过 程 的 假设 要 求 在 等 长 度 的 区 间 上 发 生 的 事件 具有 等 可 能 
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四: 六 人; 
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性 . 而 在 实际 生活 中 ;有 些 事件 的 发 生 可 能 性 是 与 时 间 相 关 的 . 例如 , 某 个 餐馆 
在 进餐 时 间 来 就 餐 的 客人 就 多 些 , 而 在 其 他 时 间 来 进餐 的 客人 就 少 些 . 如 果 用 
上 一 节 的 Poisson 过 程 来 刻画 这 个 餐馆 一 天 的 客流 量 就 不 太 合 适 , 就 要 放宽 假 
设 条 件 ,用 所 谓 非 齐 次 的 或 者 非 平 稳 的 Poisson 过 程 来 刻画 . 

假设 事件 随机 发 生 且 N(1) 表示 到 时 间 上 时 事件 发 生 的 个 数 , 且 有 

(1) N(0)=0; 

(2) N(t) 是 独立 增 量 过 程 , 即 任 取 0 < i <t <… < 

N(H) NGG). = Nit) = NG = M(tsi) 

相互 独立 ; 

(3) 对 任何 ! > 0,s 三 0, 增 量 W(Cs+i) ~N(s) 服从 参数 为 A(1) 的 Poisson 
分 布 , 即 
1 A Oy . 

kl 2 
则 {N(2) ,t 宇 0| 构成 了 一 个 具有 强度 函数 为 A(i) ,三 0 非 齐 次 的 Poisson 过 
程 .我 们 称 函 数 


PIN(s +1) - N(s) = | 


m(t) = AC), 1 三 0 


为 均值 函数 ， 

强度 函数 A(i) 形象 地 刻画 了 在 时 刻 i 一 个 事件 发 生 的 可 能 性 的 大 小 . 注 
意 到 当 A(it) 二 Ai 时 , 非 齐 次 过 程 就 成 为 通常 的 时 齐 Poisson 过 程 . 

【 例 1.6) (记录 值 ) 设 X,,n = 1,2,… 是 一 申 独立 同 分 布 的 随机 变量 序 
列 , 且 分 布 为 FR(i), 密度 为 Ai): 当 X, 代表 某 一 元 件 的 寿命 时 , A(1) = 


人 2, 党 定义 为 失效 率 . 它 的 直观 意义 为 : (1) 近似 地 等 于 己 X = X > | ， 


即 元 件 在 时 刻 i 仍 在 工作 ,而 在 i 的 下 一 瞬间 失效 的 条 件 概率 密度 . 
记 和 =0, 当成 过 max| Xi ,XX,,… ,XX,_1| 时 ,也 就 是 当 X, 的 值 超过 以 前 任 
何 记 录 时 , 称 在 时 刻 n 创 了 记录 ,XX, 则 称 为 所 创 的 记录 值 . 以 N(1) 记 小 于 或 
等 于 i 的 记录 值 的 个 数 , 则 随机 过 程 | N(1) ,t > 0| 是 非 齐 次 的 Poisson 过 程 ， 
其 强度 函数 正好 是 失效 率 和 A(t). 例如 ， 
PIN(t)=0}=PIX, > 
=1— F(t)=exp(ln(l1 ~ F(i))) 


0 TA) > | | 








(oo se(- a 
kl 











中 第 1 章 预备 知识 





【 例 1.7】 假设 事件 按照 一 个 速率 为 A 的 Poisson 过 程 发 生 而 且 独 立 于 
任何 一 个 以 前 到 来 的 事件 ,又 假设 在 时 刻 t 发 生 的 一 个 事件 以 概率 p(t) 被 计 
数 , 则 被 计数 的 事件 的 过 程 构成 了 一 个 强度 函数 为 A(1) = Ap(1t) 的 非 齐 次 的 
Poisson 过 程 . 


1.4 Markov 链 


由 于 Markov 链 在 Bayes 统计 推断 的 模拟 中 起 到 很 重要 的 作用 ,所 以 本 节 
对 Markov 链 作 一 些 介绍 . 

独立 随机 试验 模型 最 直接 的 推广 就 是 Markov 链 模型 , 因 早 在 1906 年 对 
它 进行 研究 的 俄国 数学 家 Markov 而 得 名 . 以 后 Kolmogorov, Feller 和 Doob 等 
数学 家 发 展 了 这 一 理论 . 粗略 而 言 ,一 个 随机 过 程 如 果 给 定 了 当前 时 刻 : 的 值 
X,, 未 来 时 刻 X,(s > t) 的 值 不 受过 去 值 X,(w < i) 的 影响 , 则 称 之 为 具有 
Markoy 性 . 当 指 标 集 T 是 非 负 整数 集 时 ,过 程 称 为 离散 时 间 Markov 链 ; 而 当 指 
标 集 7 是 区 间 时 ,过 程 称 为 连续 时 间 Markov 链 ; 进 一 步 , 若 状态 空间 也 是 连续 
的 , 则 是 Markov 过 程 . 

定义 1.4 ”如果 对 任何 一 列 状态 io, 计 ,…, 记 ,i,j 以 及 对 任何 时 刻 n > 0， 
若 随机 过 程 {X,,n = 0,1,2,…| 满足 Markov 性 : 
Pd adh 呈 丰 5 各 二 轴 ，rsry 着 二 二 1) 王 二 双 -二 汕 寺 区 二 证 王 - 疡 计 。 
则 称 随机 过 程 {X, ,n = 0,1,2,…| 为 离散 时 间 的 Markov 链 , 称 PIX,,, = j|XY,= 让 
为 Markov 链 的 一 步 转移 概率 . 记 为 PP ”. 

进一步 ,如 果 条 件 概率 PIX,,，=j| X= 计 与 时 刻 n 无 关 , 则 称 该 Markov 
链 有 平稳 转移 概率 , 记 为 P;. 有 时 称 具 有 平稳 转移 概率 的 Markov 链 为 时 间 齐 
性 (homogenized ) 的 Markov 链 , 或 简称 为 时 齐 的 Markov 链 . 

易 知 ,对 任意 的 i,j 二 0， 


局 着 0 . 役 5 py. 
为 方便 起 见 ,我 们 可 以 将 一 步 转移 概率 用 和 矩阵 表达 出 : 


Po Po Po, 
Po Pp Pi 
mad 
Po Pi P» 


【 例 1.8】 (直线 上 的 随机 游 动 ) 考 虑 在 直线 的 整数 点 上 运动 的 粒子 . 当 
11 
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它 处 于 位 置 j 时 ,向 右 移 动 到 j + 1 的 概率 为 p, 而 向 左 移动 到 j - 1 的 概率 为 
g = 1 - p. 假定 时 刻 0 时 粒子 处 于 原点 , 即 X。= 0, 于 是 粒子 在 时 刻 n 所 处 的 
位 置 X, 就 是 一 个 时 齐 的 Markov 链 . 其 转移 概率 为 
psk=j+1, 
B= gk si = 1; 
0,k 取 其 他 值 . 
当 p =q = 0.5 时 ,就 是 简单 的 对 称 随机 游 动 . 它 可 以 用 于 公平 赌博 模型 中 . 如 


果 甲 有 赌资 4, ， 乙 有 赌资 4,, 则 可 以 证 明 乙 先 输 光 的 概率 


资 越 多 越 容易 取得 最 后 的 胜利 . 它 在 统计 学 的 序 贯 分 析 中 也 很 有 用 . 
一 个 时 齐 的 Markov 链 可 由 它 的 初始 状态 Xu 的 概率 分 布 以 及 转移 概率 矩 
阵 完全 确定 . 记 P|X。=is| = Pi， 易 知 
六 == 认 y 要 | 
PI = 加 ,下 = | 
-PIX =i |X =i ,Yi Si, = =) 





二 = io 已。 和 和 和 

在 Markov 链 的 分 析 中 ,人 们 所 关心 的 是 过 程 可 能 实现 的 概率 有 多 大 . 也 
就 是 ,在 时 刻 m 时 , 它 处 于 状态 i, 那么 经 过 时 间 后 它 处 于 状态 7 的 概率 有 多 
大 ? 记 PIX。 =j|X。= 计 = Pi ,我 们 得 到 = 步 转移 矩阵 

P™ =(Pp®). 
易 知 
P=PxPx:…xP=P". 

【 例 1.9】 (排队 问题 ) 顾 客 到 服务 台 排 队 等 候 服务 . 在 每 一 服务 周期 中 
只 要 台 前 有 顾客 在 等 待 ,就 要 对 排 在 队 前 的 一 位 顾客 提供 服务 . 当然 ,如 果 服 
务 台 前 是 空 的 ,就 不 可 能 实施 服务 . 设 在 第 个 服务 周期 ( 指 对 第 n 个 顾客 的 
服务 ) 中 到 达 的 顾客 数 为 一 随机 变量 7,, 其 分 布 为 


PIY,=k} =p,, k=0,1,.…, =1, 
pi: Pn: 


并 且 Y, 是 相互 独立 的 . 记 X, 是 在 第 ”个 服务 周期 开始 时 服务 台 前 排队 的 顾 
客 数 , 则 显然 有 
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和 策 下 帝 大 玫 次 关机 训 和 


/ 


则 互 , 为 Markov 链 , 其 转移 概率 矩阵 为 

po PP Ps Ps 
po Pp! Pp ps Ps 
0 po Pp! Pa Ps 


0 0 po pp Pp 
0 0 0 po pi 


这 是 因为 

P{X,, =k|X, =0} =PIY, =k} =p,, k=0,1,. 

P| =k|X,.=1} sP{Y. = = PB k=0,l, 

PIX,, =0|X,=2} =0， 
plXi sl | == =04 = 

如 果 对 某 一 时 刻 n = 0, 有 Ps”> 0, 则 称 状态 i 可 以 到 达 状 态 j (accessible)， 
记 为 i 一 j. 它 表示 从 状态 i 经 有 限 步 可 以 到 达 状 态 j. 如 果 从 状态 i 经 有 限 步 
可 以 到 达 状 态 j, 反之 亦 然 , 则 称 状 态 i 和 状态 j 是 互通 (communicative) 的 , 记 
为 i 

如 果 Markov 链 的 所 有 状态 互通 , 则 称 此 Markov 链 是 不 可 约 (irreducible) 
的 . 

设 ;为 Markov 链 的 一 个 状态 ,使 P!” > 0 的 所 有 正 整 数 n(n 之 1) 的 最 大 
公约 数 , 称 为 状态 i 的 周期 (period). 记 为 4(i). 如 果 d(i) = 1, 称 状态 i 为 非 
周期 的 . 

如 果 对 所 有 正 整数 n(n > 1) 都 有 Ph) = 0, 称 状态 i 的 周期 为 %. 

【 例 1.10】 考虑 只 有 0,1 两 个 状态 的 随机 过 程 1X,,n > 01, 转移 概率 
矩阵 为 

1 -= a Qo 
| Bp 1 -J 
当 a = 1-B 时 , 易 验证 X, 为 独立 同 分 布 的 随机 变量 , 且 
PIX,=0|} =p, PIX,=1}=1-8p. 
当 a 关 1-B 时 , 易 验 证 ,为 Markov 链 . 

问题 : 当 经 过 长 时 间 转 移 后 , X, 处 于 状态 0 的 概率 为 多 大 ? 

分 析 : 设 To = infln:P{X,=0|Xo = 计 }, 称 7 为 状态 0 的 首 达 时 .其 分 布 
为 

PIT =1|X, =0} =PIX,=0|X =0}=1-a=/0; 
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PIT =2|X, =0} =PIX, 0,X ;= TI =0|} 
=PIX, =0|X =1FP{IX =1|X, =0} 
=ap = fw ; 
PIT,=3|X, =0} =PIX; =02 三 1, =1|X,,=0} 
=P{X, =0|X,=1}PIX,=1|X,=1IPIX,=1|X,=0| 

















= aB(l -pB) = fo0". 
由 归纳 法 知 ， 
PT =n | = 0 spl -A mh, 
记 
B a ac -a 
A= B= 
( 了 We hy 
则 
P= 1 ke 
a+pB ac+B 
且 易 知 
p"-_ 1 A+(-e-ph) py 
a+pB a+p 
进而 
_B _a 
ps at | | 
-eo QA+p ~ _B _ea 
a+pB a+Bp 


这 告诉 我 们 ,不 论 初 始 状 态 是 什么 ,在 经 过 相当 长 的 一 段 时 间 以 后 ,过 程 会 以 





» n 日 n a 
‘limP® Pe 区 本 
为 此 Markov 链 的 平稳 分 布 , 记 为 (ro mi). 
一 般 而 言 ,如 果 某 个 Markov 链 的 状态 是 有 限 的 ,不 可 约 的 且 非 周期 的 , 则 
一 定 存在 平稳 分 布 ,将 其 平稳 分 布 记 为 z 三 (7o,71，,…,7T1). 一 般 根 据 下 
述 方法 比较 容易 计算 7 


7 = 7P, 且 三 m -1 


车 TriP = TjPj;， 则 称 此 Markov 链 为 可 逆 的 .可逆 Markov 链 在 8. 2 节 的 
MCMC 方 法 中 有 重要 的 作用 . 易 验 证 例 1. 10 为 可 逆 Markov 链 . 
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练 习 1 


1. 若 忒 是 一 个 参数 为 (n,A) 的 Gamma 随机 变量 , 试 计 算 随 机 变量 了 的 
期 望 E[X] 和 方差 Var(X): - 

2. 一 个 装 有 4 个 白 球 和 6 个 黑 球 的 钢 子 . 选择 一 个 容量 为 4 的 随机 样本 ， 
令 并 表示 在 这 个 样本 中 的 白 球 数 . 现 从 经 子 中 剩 下 的 6 个 球 中 选取 一 个 . 令 

了 若 此 球 为 白 球 ， 
0， 否则 . 

计算 

(1) E[Y|X=2].; 

(2) E[X|Y=1]; 

(3) Var(Y |X=0); 

(4) Var(X|Y=1); 

3. 如 果 了 对 和 了 是 独立 同 分 布 的 指数 随机 变量 ,证 明 在 给 定 了 + 了 Y=: 的 条 
件 下 ,站 的 条 件 分 布 为 (0,t) 上 的 均匀 分 布 . 

4. 考虑 一 个 Poisson 过 程 , 其 事件 发 生 的 速率 为 每 小 时 0.3, 则 在 上 午 10 
点 到 下 午 2 点 之 间 没 有 一 个 事件 发 生 的 概率 为 多 少 ? 

5. 对 一 个 速率 为 和 的 Poisson 过 程 , 当 s < 1 时 ,计算 PIN(s)=k|N(i) = 
n}. 

6. 对 s > 1, 再 做 题 5. 

7. 令 7j,j = 1,2,…,N 表示 一 个 Markov 链 的 平稳 概率 . 证 明 如 果 
PlX, =j| =7),7 = 1,2,…,N, 则 

PI{X, = 省 =Ti， 对 所 有 的 nj. 

8. 令 0@ 是 一 个 对 称 的 转移 概率 矩阵 ,也 就 是 ,对 所 有 的 i,j, q; = q;. 考虑 

一 个 Markov 链 ,当当 前 状态 是 i 时 ,产生 一 个 随机 变量 X 的 值 使 得 PIX=j} = 


qi, 如 果 X=j, 则 此 Markov 链 或 者 以 概率 进入 到 状态 j, 否则 停留 在 状 
态 记 其 中 与 jj= 1,2,…,N 是 确定 的 正 数 .证 明 此 Markov 链 是 时 间 可 闻 的 并 具 
有 极限 概率 ri = Cb,j = 1,2,…,N. 
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~ 第 轧 章 全 
R 介 绍 


本 书 的 宗旨 是 对 如 何 实现 统计 模拟 的 内 容 进 行 介 绍 ,而 统计 模拟 的 实现 
必须 借助 随机 数 这 个 强 有 力 的 工具 ,以 及 相应 的 算法 .目前 国际 上 流行 的 一 种 
软件 一 一 R 软件 ,特别 适合 于 做 统计 模拟 ,所 以 我 们 选择 这 个 软件 来 实现 统计 
模拟 的 算法 . 

R 软件 作为 一 个 计划 (project) ,最 早 (1995 ) 由 Auckland 大 学 统计 系 的 
Robert Gentleman 和 Ross Ihaka 开始 编制 ,目前 由 R 核心 开发 小 组 (R Develop- 
ment Core Team ) 维护 . 小 组 成 员 完全 自愿 工作 ,努力 负责 ,并 将 全 球 优秀 的 统 
计 应 用 软件 打包 提供 给 用 户 .用 户 可 以 通过 R 计划 的 网 站 ( http://www. r-pro- 
ject org) 了 解 有 关 R 的 最 新 信息 和 使 用 说 明 ,得 到 最 新 版 本 的 R 软件 和 基于 
R 的 应 用 统计 软件 包 . 

R 软件 由 一 组 数据 操作 、 计 算 和 图 形 展示 的 工具 构成 ,相对 于 其 他 同类 软 
件 ,其 特色 在 于 : 

(1) 有 效 的 数据 处 理 和 保存 机 制 ; 

(2) 完 整 的 数组 和 和 拖 阵 计算 操作 符 ; 

(3) 连 贯 而 又 完整 的 数据 分 析 工 具 ; 

(4) 图 形 工具 可 以 对 数据 直接 进行 分 析 和 展示 ,同时 可 用 于 多 种 图 形 设 
备 ; ; 

(5) 它 是 一 种 相当 完善 .间接 而 又 高 效 的 程序 设计 语言 (也 就 是 “5S”), 它 
包括 条 件 语 句 、 循 环 语句 、 用 户 定义 的 递归 函数 以 及 各 种 输入 输出 接口 . 

R 是 一 个 非常 好 的 开发 新 的 交互 式 数据 分 析 方 法 的 工具 , 它 的 开发 周期 
短 , 有 大 量 的 扩展 包 ( package) 可 以 使 用 . R 有 强大 的 统计 功能 ,大 多 数 经 典 的 
统计 方法 和 最 新 的 技术 都 可 以 在 R 中 直接 得 到 . 

R 是 自由 软件 ,不 向 使 用 者 收取 任何 费用 . 它 是 彻底 地 面向 对 象 的 编程 语 
言 , 和 Matlab 很 相像 .用 户 要 安装 时 ,可 以 进入 http://cran. r-project. org, 下 载 
“Download and Install R”" 栏 中 的 软件 ,点 击 “Windows”, 进 入 base ,下 载 “ Down- 
load R xxxx for Windows”( 如 Download R 2.9.1 for Windows, 目 前 最 新 版 本 为 
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R 2.10.1) ,然后 按 提示 安装 即 可 . 


2.1 R 软件 基本 操作 


R 系统 的 基本 界面 是 一 个 交互 式 命令 窗口 ,命令 提示 符 是 一 个 大 于 号 , 即 
“>”. 命令 运行 的 结果 马上 显示 在 命令 下 面 . R 命令 有 两 种 形式 :表达 式 和 赋 
值 运算 (用 “< -” 或 “=” 表 示 赋 值 运算 符 ). 在 命令 提示 符 后 键 人 一 个 表达 
式 表示 计算 此 表达 式 并 显示 结果 . 例如 : 

>3 * *2+sqrt(4) 
Fe 

赋值 运算 把 赋值 号 右边 的 值 计 算出 来 并 赋 给 左边 的 变量 . 
>xl<-0:10;xl # 如 果 一 条 语句 后 继续 写 语句 ,需要 用 “;” 隔 开 . 
[1]012345678910 

符号 # 和 表示 此 符号 以 后 的 这 行 语 句 是 注释 语句 ,R 软件 是 不 会 执行 的 。 

可 以 用 向 上 光标 键 来 找 回 以 前 运行 的 命令 ,再 次 运行 或 修改 后 再 运行 . R 
是 区 分 大 小 写 的 ,所 以 x 和 X 表示 不 同 的 变量 . 

我 们 给 出 如 下 语句 来 绘制 余弦 曲线 (图 2-1). 

>xl1=0:100;xl # 如 果 不 需要 显示 xl 的 值 ,可 以 去 掉 “x1” 语 句 

>x2<-xl *2 * pi/100;x2 

>y=cos(x2);y 

>plot(xl ,y,type= "1’) 





0 20 40 60 80 100 
x 


图 2-1 余弦 曲线 


上 述 语 句 中 ,0:100 表示 一 个 从 0 ~ 100 的 等 差 数 列 向 量 . 从 第 二 个 语句 


人 了 
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可 以 看 出 ,可 以 对 向 量 直 接 进行 四 则 运算 . 从 第 三 个 语句 可 以 看 到 ,函数 可 以 
输入 向 量 ,并 输出 向 量 . 从 最 后 一 个 语句 可 以 看 出 ,函数 的 调用 也 很 自由 . 再 看 
一 个 例子 : 

>vect<-c(10,6,4,7,8) 

>mean( vect) 

[7 

>sd( vect) 

[1]2. 236066 

>min( vect) 

[1]4 

>median ( vect) 

E17 

>max( vect) 

[1]10 

>boxplot( vect) 

第 一 个 语句 输入 若干 数据 到 一 个 向 量 ,函数 c( ) 用 来 把 数据 组 合 为 一 个 
向 量 . 后面 用 了 几 个 函数 来 计算 数据 的 均值 .标准 差 、 中 位 数 、 最 小 值 以 及 最 大 
值 . 最 后 的 函数 绘制 数据 的 盒 形 图 . 

R 也 提供 了 一 般 的 计算 功能 . 例如 , 求 一 个 矩阵 的 逆 : 

>A=matrix(c(1,2,7,3),ncol=2,byrow=T);A 

>Ai=solve( A);Ai 

还 可 以 进行 矩阵 运算 ,如 

>b<-c(2,3) 

>x=Ai% * %b 

>xX 

这 实际 上 是 求解 了 一 个 线性 方程 组 .“% * % ”表示 矩阵 的 乘法 . 

可 以 把 若干 行 命令 保存 在 一 个 文本 文件 (比如 D:\\simR\\R090806.r) 
中 ,然后 用 source 函数 来 运行 整个 文件 . 

>source(“D.:\\simR\\R0O90806.7r”) 


要 退出 R, 可 以 用 q( ) 函数 ,也 可 以 用 窗口 上 较 . R 在 退出 时 会 提示 是 否 
保存 当前 工作 空间 , 它 可 以 把 当前 定义 的 所 有 对 象 (有 名 字 的 向 量 . 和 矩阵 、 列 
表 、 函 数 等 ) 保存 到 一 个 文件 中 . 
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2;2 R 向 量 


R 是 基于 对 象 的 语言 ,不 过 其 最 基本 的 数据 还 是 预先 定义 好 的 数据 类 型 ， 
如 向 量 `\ 矩 阵 、 列 表 等 . 更 复杂 的 数据 用 对 象 表示 ,比如 ;数据 框 对 象 \. 时 间 序 列 
对 象 、 模 型 对 象 、 图 形 对 象 等 , ， 

R 语言 表达 式 可 以 使 用 常量 和 变量 .变量 名 的 规则 是 :由 字母 .数字 和 和 名 
点 组 成 ,第 一 个 字符 必须 是 字母 或 句点 ,长 度 没有 限制 ,区 分 大 小 写 : 特别 注意 
句点 可 以 作为 名 字 的 合法 成 分 ,而 在 其 他 面向 对 象 语言 中 句点 经 常用 来 分 隔 
对 象 与 成 员 名 . 

“1. 常 量 


常量 笼统 地 分 为 逻辑 型 数值 型 和 字符 型 三 种 .实际 上 数值 型 数据 又 可 分 
为 整 型 \ 单 精度 、 双 精度 等 . 除非 特殊 需要 ,否则 不 必 太 关心 其 具体 类 型 , 例如 ， 
123 ,123. 45 ,1.2345e30 是 数值 型 常量 “Weight”“ 李 明 ” 是 字符 型 (用 双 引 号 
或 单 引号 包围 ). 逻辑 真 值 写 为 TRUE( 注 意 区 分 大 小 写 , 写 为 tue 没有 意义 ) ， 
逻辑 假 值 写 为 FALSE. 复数 常量 如 2. 1-3.5i 这 样 表示 。 
R 中 的 数据 可 以 取 缺 失 值 ,用 NA 表示 缺失 值 . 函数 is. na(x) 返 回 x 是 否 
缺失 值 . 
2. 向 量 与 赋值 
向 量 (vector) 是 具有 相同 基本 类 型 的 元 素 序 列 , 大 体 相 当 于 其 他 语言 
的 一 维 数组 .在 R 中 标量 也 被 看 做 一 维 的 向 量 . 定义 向 量 的 最 常用 的 方法 是 
使 用 函数 c(). 它 把 若干 个 数值 或 字符 串 组 合 为 一 个 向 量 , 比 如 : 
>x=c(1:3,10:13) 
>x 
[1] 123 1011 1213 
2x] Schl 2 
>x2<- c(3,4) 
> x<— c(xl] ,x2) 
[1] 1234 
在 显示 向 量 值 时 ,注意 到 左边 出 现 一 个 “[1]”, 这 表示 该 行 的 第 一 个 数 的 下 
标 , 例 如 : 
>12 :78 
[1] 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 
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35 36 
[26] 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 
59 60 61 
[51] 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 
第 三 行 输出 从 第 26 个 数 开始 ,所 以 在 行 左 边 显示 “ [26]”. 
函数 length(x) 可 以 计算 向 量 x 的 长 度 , 例 如 : 
>x<- c(12:78) 
>x]=length (x) 
>xl 
[1] 67 
3. 向 量 运 算 
可 以 对 向 量 进行 加 (+)\ 减 (-)、 乘 ( * ) 、 除 (/)、 乘 方 ( * * 或 者 ) 运 算 ， 
其 含义 是 对 向 量 的 每 一 个 元 素 进行 运算 .例如 : 
> w=e(1,2, 6.25) 
>y=x* *2+l];y 
[1] 2. 0000 5.0000 40. 0625 
另外 ,%/% 表示 整除 (例如 5%/%3=1),%% 表示 求 余 数 ( 例 如 
5% %3=2). 
两 个 等 长 度 向 量 间 进行 加 \、 减 、 乘 、 除 和 乘 方 运算 ,其 含义 是 对 应 元 素 间 进 
行 四 则 运算 ,例如 : 
>c(1,2,3)+c(10,20,30)/c(2,4,5) 
[11 679 
两 个 长 度 不 同 的 向 量 间 进行 加 、 减 、 乘 、 除 和 乘 方 运算 时 ,长 度 短 的 将 循环 
使 用 ,但 长 度 长 的 长 度 应 为 短 的 整数 倍 ,例如 : 
> c(1,2,3)+c(10,20,30,-2,-4,-9,0,0,1) 
[1] 11 22 33 -1 -2 -6 1 2 4 
函数 sqrt、log、exp、sin、cos 和 tan 等 都 可 以 用 向 量 做 自 变量 ,结果 是 对 向 
量 的 每 一 个 元 素 取 相应 的 函数 值 ,例如 : 
> x=c(1, 2, 6.25) 
> sqrt(x) 
[1] 1.000000 1.414214 2.500000 
上 述 例子 中 出 现 6 位 小 数 ,在 实际 中 有 时 并 不 需要 达到 此 精度 ,可 以 用 命 
令 options( digits=3) 来 控制 结果 的 有 效 位 数 输出 . 例如 : 
>options( digits= 3 ) 
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> sqrt(x) 
[1] 1.00 1.41 2.50 
函数 min 和 max 分 别 取 自 变量 向 量 的 最 小 值 和 最 大 值 ,函数 sum 计算 自 变量 
向 量 的 元 素 和 ,函数 mean 计算 均值 ,函数 var 计算 样本 方差 ,函数 sd 计算 标 
准 差 .但 注意 , 若 变量 x 为 矩阵 , 则 var(x) 为 协 方差 阵 . 函数 range 返回 包含 最 
小 值 和 最 大 值 的 向 量 . sort(x) 返 回 按 x 的 元 素 从 小 到 大 排序 的 结果 向 量 ， 
order(x) 返 回 使 得 x 的 元 素 从 小 到 大 排序 的 元 素 下 标 向 量 , 但 x[order(x) ] 等 
效 于 sort(x). 例如: 
> z=c(-3,-9,8,2,0,-8) 
> range(z) 
[1] -9 8 
> sort(z) 
[1] = = 
> order( z) 
[1] 261543 
> z[ order(z) ] 
[和 
若 想 将 向 量 值 从 大 到 小 排序 ,使 用 函数 sort( zydecreasing=TRUE ) 即 可 . 
任何 函数 值 与 缺失 值 的 运算 结果 仍 为 缺失 值 . 例如 : 
> c(1,2,NA)-c(1,NA,4) 
[1] 0 NA NA 
4. 产 生 有 规律 的 数列 
调用 R 的 函数 numeric(n) 可 以 产生 填充 了 mn 个 零 的 向 量 . 在 R 中 很 容易 
产生 一 个 等 差 数列 . 例如 : 
> ns5 
> 1:n 
[1] 12345 
>n:2 
[1] 5432 
>1l:n-l 
[1] 01234 
> 1:(n-1) 
[1] 1234 
注意 区 别 1:n-1 与 1:(n-1). 
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seq 函数 是 更 一 般 的 等 差 数 列 函 数 . 如 果 只 指定 一 个 自 变量 n>0, 则 
seq(n) 相 当 于 1:n. 指定 两 个 自 变量 时 ,第 一 个 自 变量 是 开始 值 , 第 二 个 自 变 
量 是 结束 值 . 如 seq(-2;3)5 也 可 以 写 为 seq(from=-2;ito=3) .还 可 以 用 一 个 
参数 by 指定 等 差 数 列 的 步 长 ,by 可 以 放 在 seq 内 任何 位 置 ,例如 : 

>seq( -2,3) 

[11. 2310123 

> seq(from=-2,to=3) 

[1] -2 -10123 

> seq(0,1,0.1) 

[1] 0.0 0.10.20.30.40.50.60.70.80.91.0 
> seq(0,by=0.2,1) 

[1] 0.00.20.40.60.81.0 

> seq(by=0.2,from=0,1) 

[1] 0.0 0.2 0.40.60.81.0 

也 可 以 用 参数 length 指定 数列 长 度 , 例 如 : 

> seq(0,length=5) 

[1] 01234 

> seq(length=5 ,to=8) 

[1] 45678 

seq 函数 还 可 以 用 一 种 seq( along= 向 量 名 ) 的 格式 ,产生 该 向 量 的 下 标 序 
列 , 例 如 : 

>w<- c(4,-2,7,0) 
> seq(along=w) 
[1] 1234 

另 一 个 类 似 的 函数 是 rep, 它 可 以 重复 第 一 个 自 变 量 若干 次 ,例如 : 

> rep(w,2) 

[1] 4-2704 -270 

> rep(c(10,28),c(2,3)) 
[1] 10 10 28 28 28 

第 一 个 参数 名 为 变量 名 ,第 二 个 参数 为 times (重复 次 数 ). 也 可 以 写 为 
rep( times=2,w). 

5. 逻辑 向 量 


向 量 可 以 取 逻 辑 值 , 例 如: 
>1<- ec(TRUE，TRUE，FALSE) ;1 
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[1] TRUE TRUE FALSE 
> ]1 <- w>3;ll 
[1] TRUE FALSE TRUE FALSE 
一 个 向 量 与 常量 比较 大 小 ,结果 还 是 一 个 向 量 ,元 素 为 每 一 对 比较 结果 的 
逻辑 值 . 
两 个 向 量 也 可 以 比较 ,例如 : 
> log(10 * w) 
[1] 3.688879 NaN 4.248495 = Inf( 无 穷 大 ) 
> log(10 * w) >W 
[1] FALSE NA FALSE FALSE 
比较 运算 符 包 括 :<,<= ,>=,==( 相 等 )，!= (不 等 ). 
两 个 逻辑 向 量 可 以 进行 与 运算 (&) 或 运算 ( | ) ,结果 是 对 应 元 素 运 算 的 
结果 . 对 逻辑 向 量 1 计算! 1 表示 取 每 个 元 素 的 非 . 
> (w>3)&(c(0,3,5,6)<2) 
[1] TRUE FALSE FALSE FALSE 
> ! (w>3) 
[1] FALSE TRUE FALSE TRUE 
判断 一 个 逻辑 向 量 是 否 都 为 真 值 的 函数 是 al ,例如 : 
> all(! (w>3)) 
[1] FALSE : 
判断 一 个 逻辑 向 量 是 否 有 真 值 的 函数 是 any, 例 如 : 
> any(! (w>3)) 
[1] TRUE : 
函数 is. na(x) 用 来 判断 x 的 每 一 个 元 素 是 否 缺 失 , 例 如 : 
> is.na(c(1,0,NA) ) 
[1] FALSE FALSE TRUE 
逻辑 值 可 以 强制 转换 为 整数 值 , 如 TRUE 变 为 1,FALSE 变 为 0. 例如 : 
> age=30 
> c("young" ,"old" )[(age>65)+1] 
[1] "young" 
6. 字符 型 向 量 
向 量 元 素 可 以 取 字 符 串 值 ,例如 : 
Scl=0 "x" "an(x)" "和 年龄" 》wel 
[1]"x" "tan(x)"" 年 龄 " 
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函数 paste 用 来 把 它 的 自 变量 连 成 一 个 字符 串 ,中 间 用 空格 隔 开 ,例如 : 
> paste( "1","love" ,"homeland" ) 
[1]"I love homeland" 
又 如 : 
> paste(c("X","Y"),"=",1:4) 
[I]"X=1" "Y=2" "X=3" "Y=4" 
分 隔 用 的 字符 可 以 用 sep 参数 指定 .下 例 产生 若干 个 文件 名 : 
> paste("result.", 1:5, sep=" ") 
[1]"result. 1" "result. 2" "result. 3" "result. 4" "result. 5" 
如 果 给 paste( ) 函数 指定 了 参数 collapse, 则 paste( ) 函数 可 以 把 一 个 字符 
串 向 量 的 各 个 元 素 连 接 成 一 个 字符 串 , 中 间 用 collapse 指定 的 值 分 隔 . 例如 : 
> paste(c("123" ,"234" ) scollapse=" *") 
[1]"123 * 234" 
7. 向 量 下 标 运算 
访问 向 量 的 某 一 个 元 素 可 以 用 x[i] 格 式 ,其 中 x 是 一 个 向 量 名 ,或 一 个 
取向 量 值 的 表达 式 ,i 是 一 个 下 标 ,例如 : 
> x=seq(1,8,by=2);x[2] 
[1] 3 
> (c(2,4,6)+(-2))[2] 
[1] 2 
还 可 以 单独 改变 一 个 元 素 的 值 ,例如 : 
> x[2] =125;x 
[1] 1 125 57 
R 提供 了 4 种 方法 访问 向 量 的 一 部 分 ,格式 为 x[v] ,x 为 向 量 或 向 量 值 的 
表达 式 ,v 是 如 下 的 一 种 下 标 向 量 . 
( i ) 取 正 整数 值 的 下 标 向 量 
在 x[] 中 ,v 为 二 个 向 量 ;元 素 取 值 在 1~length(x) 之 间 ; 取 值 允 许 重复 ， 
例如 : 
>x[c(1,3)] 
[1] 15 
> x[1:2] 
[1] 1 125 
>x[c(1,3,2,1)] 
[1] 15 1251 
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> ela "bh", "oc" yp(et(2; L130 
[1] “br "oy "er Dh" Ma Mor Wh Ma .Men 
(让) 取 负 整数 值 的 下 标 向 量 
在 x[v] 中 ,v 为 一 个 向 量 ,元 素 取 值 在 -length(x) ~-1 之 间 , 表 示 去 掉 相 
应 位 置 的 元 素 ,例如 : 
>x[c(-1,-3)] 
[1] 1257 
( 道 ) 取 逻辑 值 的 下 标 向 量 
在 xLv] 中 ,v 为 和 x 等 长 度 的 逻辑 向 量 ,x[v] 表 示 取 出 所 有 v 为 真 值 的 元 
素 ,例如 : 
> x>3 
[1] FALSE TRUE TRUE TRUE 
> 半 [ 流 :3 
[1] 12557 
> x[x<(-9)] 
numeric (0) 
可 见 x[x>4] 取 出 所 有 大 于 4 的 元 素 . 这 种 逻辑 值 下 标 是 一 种 强 有 力 的 检 
索 工具 ,例如 x[tan(x)>0] 可 以 取出 x 中 所 有 使 正切 值 为 正 的 元 素 组 成 的 向 
量 . 如 果 下 标 都 是 假 值 , 则 结果 显示 一 个 长 度 为 零 的 向 量 , 即 numeric(0). 
(Ci ) 取 字符 型 值 的 下 标 向 量 
在 定义 向 量 时 ,可 以 给 元 素 加 上 名 字 ,例如 : 
> ages=c(Li=33,zhang=29,Liu=18) 
> ages 
Li zhang Liu 
33 29 18 
这 样 定义 的 向 量 可 以 用 通常 的 方法 访问 ,另外 ,还 可 以 用 元 素 名 字 来 访问 
元 素 或 元 素 子 集 ,例如 : 
> ages[ "zhang" ] 
zhang 
29 
> ages[ c("zhang", "Li")] 
zhang Li 
29 33 
在 R 中 还 可 以 改变 一 部 分 值 ,例如 : 
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> x[c(1,3)]=c(188，189 ) 
>X 
[1] 188 3 189 7 
注意 赋值 的 长 度 必须 相同 。 另 外 ,可 以 把 部 分 元 素 赋 为 一 个 统一 的 值 : 
>x[c(1,3)]<- 0 
>X 
[1] 0307 
要 把 向 量 所 有 元 素 赋 为 一 个 相同 的 值 ,可 以 用 x[ ] 格 式 , 例 如 : 
潜 x[ ]z0 
>X 
[1] 0000 
但 是 
> x<-0 
>X 
[1] 0 
改变 部 分 元 素 值 的 技术 与 逻辑 值 下 标 方法 结合 ,可 以 定义 向 量 的 分 段 函 
数 . 例如 ,要 定义 
1-x, 当 x < 0， 
ib Mie 
可 以 用 如 下 语句 : 
> y=numeric( length(x) ) 
> y[x<0]=1-x[x<0] 
> y[x>=0]<- 1+x[x>=0] 
> x<- c(-2.3,4,-5,7) 
> 了 
[1] 3.3 5.0 6.0 8.0 


2.3 矩阵 与 多 维 数组 


1. 和 矩阵 
R 中 的 矩阵 (matrix) 类 型 和 向 量 类 似 , 是 具有 相同 基本 类 型 (如 整数 、 浮 
点 数 、 字 符 型 ) 的 数据 集合 ,其 中 的 元 素 用 两 个 下 标 访问 . 比如 ,一 个 mxn 矩阵 
4 可 以 保存 在 R 矩阵 变量 A 中 ,A 的 第 i 行 第 j 列 元 素 为 A[i,j]. 
函数 matrix( ) 用 来 生成 矩阵 ,其 完全 格式 为 
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matrix(data=NA,nrow=1,ncol=1, byrow=FALSE ,dimnames = NULL) 
其 中 第 一 自 变量 data 为 数组 的 数据 向 量 (默认 值 为 缺失 值 NA) ,nrow 为 行 数 ， 
ncol 为 列 数 ，byrow 的 取 值 表示 数据 填 人 是 按 行 次 序 还 是 按 列 次 序 . 要 注意 默 
认 情 况 下 为 列 次 序 . dimnames 默认 是 空 值 ,否则 是 一 个 长 度 为 2 的 列表 . 列 
表 的 第 一 个 成 员 是 长 度 与 行 数 相 等 的 字符 型 向 量 , 表 示 每 行 的 标签 ;列表 的 第 
二 个 成 员 是 长 度 与 列 数 相 等 的 字符 型 向 量 ,表示 每 列 的 标签 . 例如 ,定义 一 个 
3 行 4 列 按 行 由 数据 1:12 依次 排列 的 矩阵 如 下 : 

> A<- matrix(1:12,ncol=4,nrow=3,byrow=TRUE) 

> 人 

[ES 

i 

上 ， 雪 者 和 

LS 9 i10. ， 2 

在 有 数据 的 情况 下 只 需 指定 行 数 和 列 数 之 一 . 指定 的 数据 个 数 少 于 所 需 
的 数据 的 个 数 ,这 时 循环 使 用 提供 的 数据 .例如 : 

> B=matrix(c(1,2),ncol=3 ,nrow=4) 

>B 

Ls 1 Es 3 

ee A 

【多 了 7 受 多 2 

[3] 1 1 1 

[4 ,] 沁 2 2 

用 e(A) 可 以 得 到 将 矩阵 A 的 元 素 按 列 排列 的 向 量 ,在 线性 代数 中 称 为 
“ 按 列 拉 直 ”, 例 如 : 

>c(A) 

[1] 159261037114812 

函数 cbind( ) 把 自 变量 横向 拼 成 一 个 大 和 矩阵 ,函数 rtbind( ) 把 自 变量 纵向 
拼 成 一 个 大 矩阵 ,例如 : 

> xl=rbind(c(1,2),c(3,4)) 

> xl 

[, 1] [, 2] 

Ll p 
EE ,3 4 
> x2=cbind(c(1,2),c(3,4)) 
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> x2 

LE] 已 2] 
[1 3]1 3 
只 4 


2. 访问 矩阵 元 素 和 子 矩 阵 


要 访问 矩阵 的 某 个 元 素 , 只 要 写 出 矩阵 变量 名 和 方 括号 内 分 开 的 下 标 即 
可 ,如 A[3,2] 为 10. 也 可 以 给 一 个 矩阵 元 素 赋 值 来 修改 该 元 素 . 为 了 访问 珑 
阵 A 的 第 i 行 ,只 要 用 A[i,] 格 式 即 可 ;类 似 地 ,要 访问 矩阵 A 的 第 j 列 ,只 需 
用 A[ ,jj 格式 .为 了 访问 矩阵 中 由 第 il ,i2,… ,is 行 和 第 j1,j2,… ,it 列 交叉 而 
成 的 子 矩 阵 ,只 要 用 A[ c(il ,这 ,，…,is) ,c(jL ,也 ,，…,jt)] 格 式 即 可 ,例如 : 

> A[1:2,] 

[351] [2] [3] ;4] 

[LE 1 2 3 4 

[2 ] 5 6 a 8 

> A[1:2,c(1,2,4)] 

Lsll LL 3 

i 

[2,] 5 6 8 

和 矩阵 的 行列 下 标 可 以 用 名 字 代 替 . 矩阵 的 每 行 可 以 有 一 个 行 名 ,每 列 可 
以 有 一 个 列 名 ,也 可 以 用 名 字 作 为 下 标 . 定义 行 名 用 函数 rownames( ) ,定义 列 
名 用 函数 colnames( ). 例如: 

> Townames(A)<- c("al" ,"a2","a3") 

> colnames(A)<- paste("x" ,1:4,sep="") 

> 人 

xl x2 x3 对 

al 1 贫 3 4 

a2 5 6 | 8 

a3 9 10 11 12 

5 Alva x4" |] 

[IJ 8 

3. 矩阵 运算 

矩阵 可 以 进行 四 则 运算 (+,-，* ,/，*) ,解释 为 矩阵 对 应 的 四 则 运算 , 参 
加 运算 的 矩阵 一 般 应 该 是 相同 形状 的 矩阵 . 例如 ,假设 A,B,C 是 三 个 形状 相 
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同 的 矩阵 , 则 

>D<- C+2 * A/B 2 

计算 得 到 的 结果 是 ,A 的 每 一 个 元 素 除 以 B 的 对 应 元 素 再 乘 以 2 ,然后 再 
加 上 的 对 应 元 素 , 得 到 相同 形状 的 矩阵 . 形状 不 一 致 的 矩阵 与 向 量 也 可 以 
进行 四 则 运算 . 一 般 的 规则 是 矩阵 的 数据 按 向 量 ( 按 列 拉 直 ) 的 对 应 元 素 进 行 
运算 ,并 把 元 素 个 数 少 的 向 量 循环 使 用 ,以 便 与 元 素 个 数 多 的 向 量 匹 配 , 尽 可 
能 保留 共同 的 形状 . 例如 : 

> A+c( 100,200 ,300 ) 

.ll \ 2 = ti4 

al 101 102 103 104 

a2 205 206 207 208 

a3 309 310 311 312 
结果 是 矩阵 A 按 列 拉 直 后 的 向 量 与 向 量 c(100 ,200 ,300 ) 相 加 ,得 到 12 个 元 
素 ,然后 再 恢复 为 与 矩阵 A 相同 形状 的 矩阵 . 

函数 tA) 返 回 矩 阵 A 的 转 置 (transpose) 要 进行 矩阵 乘法 运算 ,使 用 运算 
符 % * % ,A% * %B 表示 和 矩阵 A 乘 以 矩阵 B( 要 求 A 的 列 数 等 于 B 的 行 数 ). 
例如 : 


> B=matrix(c(1,0) ,nrow=4,ncol=2,byrow=T) 


> B 

[,1] [ ,2] 
ER 1 0 
[2,] 1 0 
E3;] 1 0 
{4,] 1 0 
> A% *%B 

[JE 
al 10 0 
a2 26 0 
a3 42 0 


另外 ,向 量 用 在 和 矩阵 乘法 中 既 可 以 作为 行 向 量 看 待 ,也 可 以 作为 列 向 量 看 

待 ,这 要 看 哪 一 种 观点 能 够 进行 矩阵 乘法 运算 . 例如 , 设 x 是 一 个 长 度 为 n 的 
向 量 ,4 是 一 个 m xz 和 矩阵 , 则 “x9% *%A% *%x” 表 示 二 次 型 x'Ax. 但 是 ， 
“x% * %x” 就 既 可 能 表示 内 积 x'x, 也 可 能 表示 n xz 和 矩阵 xx'. 因为 前 者 较 常 
用 ,所 以 R 选择 表示 前 者 ,但 内 积 最 好 用 crossprod( ) 来 计算 . 对 于 xx' 可 以 用 
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“cbind(x)% *% x” 或 “x W% * % rbind(x)”. 
函数 crossprod(X,Y) 表 示 一 般 的 交叉 乘积 (内 积 ) 下 了, 即 天 的 每 一 列 与 
了 的 每 一 列 的 内 积 组 成 的 矩阵 . 如 果 了 和 YY 都 是 向 量 , 则 crossprod(X,Y) 是 
一 般 的 内 积 . 如 果 互 和 了 相同 ,其 内 积 简写 为 crossprod(X) .注意 ,即使 矩阵 乘 
法 或 crossprod( ) 函数 的 结果 是 标量 ,R 仍 会 返回 一 个 1x1 矩阵 ,这 时 一 般 用 。 
() 函数 把 结果 转换 成 标量 . 
其 他 矩阵 运算 还 有 solve(A,b) , 解 线性 方程 组 4x =&. solve(A) 求 方 阵 4 
的 逆 和 矩阵 ,svd( ) 计 算 矩 阵 奇异 值 分 解 ,qr( ) 计 算 QR 分 解 ,eigen( ) 计算 特征 
向 量 和 特征 值 . 函数 diag( ) 的 作用 依赖 于 其 自 变量 . diag(vector) 返 回 以 自 变 
量 为 主 对 角 元 素 的 对 角 和 矩阵 . diag( matrix) 返 回 由 矩阵 的 主 对 角 元 素 组 成 的 向 
量 ,diag(k)(k 为 标量 ) 返 回 k 阶 单位 矩阵 . 例如 : 
> C=matrix(1:9, nrow=3,ncol=3,byrow=T) 
> diag( C ) 
[1] 1 5 9 
> diag(c(1:3)) 
二 二 王建 jst3] 
[1,] 1 0 0 
各; 0 2 0 
| 0 0 3 
> diag(3) 
[,1] [,2] [ ,3] 
Ef 
[区 os 0 1 0 
[E30 0 0 1 
4. apply 函数 
对 于 向 量 ,我 们 有 sum、mean 等 函数 对 其 进行 计算 . 对 于 矩阵 ,如果 想 对 
每 行 (或 每 列 ) 进 行 某 种 计算 ,可 以 用 apply( ) 函 数 .其 一 般 形式 为 
apply(x,margin ,fun,… ) 
其 中 x 为 一 个 矩阵 ,margin = 1 表示 对 每 行 计算 ,margin = 2 表示 对 每 列 计算 . 
fun 是 用 来 计算 的 函数 . 例如 : 
> 人 
xl x2 x3 x4 
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#83- 忽 反 ---14 12 
> apply( A,]1 ,sum) 

al a2 a3 

0 26 ” 流 

5. 数 组 


矩阵 的 元 素 用 两 个 下 标 访问 ,R 中 用 多 个 下 标 访问 的 数据 结构 是 数组 
(array) .矩阵 是 数组 的 一 个 特例 . 数组 有 一 个 特征 属性 叫做 维 数 向 量 ( dim 属 
性 ) , 维 数 向 量 是 一 个 元 素 取 正 整数 值 的 向 量 ,其 长 度 是 数组 的 维 数 ,比如 维 
数 向 量 有 两 个 元 素 时 数组 为 二 维 数 组 (矩阵 ). 维 数 向 量 的 每 一 个 元 素 确 定 了 
该 下 标的 上 界 , 下 标的 下 界 总 为 1. 

R 中 任何 一 个 变量 可 以 看 做 一 个 对 象 ,每 个 对 象 中 有 一 些 基本 数据 ,比如 
矩阵 的 各 元 素 值 ;每 个 对 象 除 基本 数据 外 还 可 能 保存 了 与 此 对 象 有 关 的 信息 ， 
称 为 对 象 的 属性 . 任何 一 个 R 对 象 都 有 两 个 固有 属性 一 一 类 型 (mode) 和 长 度 
(length). 不 同 的 R 对 象 支持 不 同 的 属性 ,比如 ;数组 有 dim 属性 ,定义 了 元 素 
名 的 向 量 有 names 属性 . 访问 对 象 x 的 属性 att 常 可 以 采用 att(x) 的 格式 ,给 
属性 赋值 常用 “att(x)<- 新 值 ”的 方法 . 

R 对 象 可 分 为 单纯 的 (atomic) 和 复合 的 (recursive) 两 种 .单纯 对 象 的 所 有 
元 素 都 是 同一 种 基本 类 型 (如 数值 .字符 串 ) ,元 素 不 再 是 对 象 ,这 样 的 对 象 类 
型 有 logical( 逻辑 型 ) .numéric (数值 型 ) 、complex (复数 型 )、character( 字 符 
型 ) ,等 等 . 复合 对 象 的 元 素 可 以 是 不 同 的 类 型 ,每 个 元 素 是 一 个 对 象 , 这样 的 
对 象 的 类 型 用 的 是 列表 . 例如 ,向 量 是 单纯 对 象 , 它 的 所 有 元 素 必须 是 相同 类 
型 ,数值 型 向 量 的 所 有 元 素 必须 为 数值 型 ,字符 型 向 量 的 所 有 元 素 必 须 为 字符 
型 .列表 是 复合 对 象 ,类 型 为 list, 列 表 的 每 一 个 元 素 (变量 ) 都 可 以 是 一 个 R 
对 象 ,比如 列表 元 素 可 以 为 一 个 数 一个 字符 串 、 一 个 向 量 甚至 一 个 列表 . 

一 组 值 只 有 在 定义 了 维 数 向 量 (dim 属性 ) 后 才能 被 看 做 是 数组 . 比如 : 

> z=1.:24 

> dim(z) <-c(2,3,4) 

沪 泛 

a 

[号 | 
LE 1 3 5 
[2,] 2 4 6 
. 
El) L322] La3} 
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| 2 
[2,] 8 10 12 
3 
[» 1] [a2] (3 
[1,] 13 15 17 
[2.4 14 16 18 
，，4 
[22 Es 
以 ] ;19 ，21。，23 
[2,] 20 22 24 
> dim(z)<-24 
>2 
[1] 123456789101112131415161718 19 20 21 22 23 24 
数组 元 素 的 排列 次 序 是 按 列 次 序 , 第 一 个 下 标 变化 最 快 ,最 后 一 个 下 标 变 
化 最 慢 . 对 于 和 矩阵 (二 维 数组 ) , 则 是 按 列 存放 . 例如 ,数组 z 的 各 元 素 次 序 为 
z[l1,1,1],z[2,1,1],z[1,2,1],z[2,2,1] ,zkEl53， 1 ,202,3,1] ,zk ,1,2] ,…， 
zl 253s4). 
用 函数 array( ) 可 以 直接 定义 数组 : 
array( x,dim=length(x) ,dimnames=NULL) 
其 中 x 是 第 一 自 变 量 ,应 该 是 一 个 向 量 , 表 示 数 组 的 元 素 组 成 的 向 量 . dim 参 
数 可 省 ,省 略 时 定义 一 维 数组 (但 一 维 数组 不 同 于 向 量 ). dimnames 属性 可 以 
省 略 ,不 省 略 时 是 一 个 长 度 与 维 数 相 同 的 列表 ; 弄 玫 的 每 从 咸 山 吉 er 维 的 名 
字 . 例如 上 面 的 z 可 以 这 样 定 义 : 
>z<— array(1:24, dim=c(2,3,4)) 
除了 访问 数组 元 素 如 z[1,2,3] ,还 可 以 访问 数组 中 类 似 子 和 矩阵 的 子 集 ， 
比如 zl[1:2,2:3,2:3] 是 一 个 维 数 为 c(2,2,2) 的 三 维 数组 , 即 
志明 
[Es E32 
[1,] 9 ad 
[2,] 10 12 
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某 一 下 标 取 一 个 值 , 则 数组 的 维 数 退 化 ,例如 ,z[ ,,4] 是 一 个 2x3 矩阵 ， 
z[ ,2,4] 是 一 个 长 度 为 2 的 向 量 : 

数组 的 四 则 运算 与 矩阵 四 则 运算 相似 . 

6. 数组 的 外 积 

两 个 数组 (或 向 量 )a 和 b 的 外 积 是 由 a 的 每 一 个 元 素 与 b 的 每 一 个 元 素 
搭配 在 一 起 相 乘 得 到 一 个 新 元 素 ,这 样 得 到 一 个 维 数 向 量 等 于 a 的 维 数 向 量 
与 b 的 维 数 向 量 连 起 来 的 向 量 , 即 若 d 为 a 和 b 的 外 积 , 则 dim(d) = 
c(dim(a) ,dim(b) ). 

a 和 上 b 的 外 积 的 格式 为 a%o%b ,也 可 以 写 为 一 个 函数 调用 的 形式 ; 
> d<- outer(a,b,'* .例如 : 

> =e(l,2) 

> b=c(2.4) 

> d=a%o%b 

> d 

[Lab] ti) La 

[1,7 2 3 # 

[有 4 6 8 

outer(a,b,f) 是 一 个 一 般 性 的 外 积 项 数 , 它 可 以 把 a 的 任 一 个 元 素 与 b 的 
任 一 个 元 素 搭配 起 来 作为 f 的 自 变量 计算 得 到 新 的 元 素 值 . 消 数 当然 也 可 以 
包含 加 、 减 .乘除 ,或 其 他 一 般 函 数 . 当 函 数 为 乘积 时 ,f 可 以 省 略 不 写 . 


例如 ,我 们 希望 计算 函数 > = 2ast24 在 一 个 x 和 y 的 网 格 上 的 值 ,用 来 给 


1 +xX 
制 三 维 曲面 图 . 用 如 下 方法 生成 网 格 及 函数 值 : 

x=seq(-2,2,length=20) 

y<-seq( -pi,pi,length=20) 

f<-function(x,y) cos(y)/(1+x’) 

z<—outer(x,y,f) 

persp(x,y,z) 

其 三 维 曲面 图 如 图 2-2 所 示 . 

又 如 ,考虑 简单 的 2x2 矩阵 [”“) ,假设 4 个 元 素 a,5,c,4 是 在 0， 
1,…,9 中 取 值 的 离散 均匀 分 布 的 相互 独立 的 随机 变量 , 求 矩阵 行列 式 ad - bc 
的 分 布 : 

首先 ,注意 到 随机 变量 ad 和 bc 同 分 布 ,其 取 值 由 以 下 外 积 和 矩阵 给 出 ,每 
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图 2-2 三 维 曲面 图 


一 个 取 值 的 概率 均 为 -1: 

dl<- outer(0:9,0:9) 
这 个 语句 产生 一 个 10 x 10 外 积 和 矩阵 . 

为 了 计算 ad 的 100 个 值 ( 有 重复 ) 与 bc 的 100 个 值 相 减 得 到 的 10000 个 

结果 ,再 使 用 如 下 外 积 函数 : 

d2<-outer( dl ,dl,"—-") 
这 样 得 到 一 个 维 数 向 量 为 c(10 ,10,10,10) 的 4 维 数组 ,每 一 个 元 素 为 行列 式 
的 一 个 可 能 取 值 ,概率 为 万 分 之 一 . 因为 这 些 值 中 有 很 多 重复 ,我 们 可 以 用 一 
个 table( ) 函数 来 计算 每 一 个 值 的 出 现 次 数 : 

{fr<~ table( d2) - 
得 到 的 结果 是 一 个 带 有 元 素 名 的 向 量 位, fr 的 元 素 名 为 行列 式 的 一 个 取 值 ,人 
的 元 素 值 为 该 取 值 出 现 的 频数 . 比如 fr[1] 的 元 素 名 为 -81; 值 为 19; 表 示 值 
-81 在 数组 d2 中 出 现 了 19 次 .通过 计算 length(fr) 可 以 知道 共有 163 个 不 同 
的 值 . 还 可 以 用 这 些 值 用 以 下 命令 绘制 一 个 频数 分 布 图 ( 除 以 10000 则 为 实 
际 概率 ) (图 2-3): 

plot(as. numeric ( names (fr)) ,fr,type =" h", xlab =" Determinant", 
ylab="frequency" ) : 
其 中 as. numeric( ) 把 向 量 fr 中 的 元 素 名 转换 成 了 数值 型 ,用 来 作为 图 的 横 坐 
标 ,位 中 的 元 素 值 ( 即 频 数 ) 作 为 纵 轴 ,type=“h ”表示 画 垂 线 型 图 . 
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图 2-3 随机 矩阵 行列 式 分 布 
2.4 因子 


在 概率 统计 中 ,变量 可 以 分 为 区 间 变 量 x 名 义 变量 和 有 序 变量 . 区 间 变 量 
取 连 续 的 数值 ,可 以 进行 求 和 : 求 平均 值 等 运算 . 名 义 变量 和 有 序 变量 取 离 散 
值 ,可 以 用 数值 代表 也 可 以 是 字符 型 值 ; 其 具体 数值 没有 加 减 乘除 的 意义 ,不 
能 用 来 计算 只 能 用 来 分 类 或 者 计数 ; 名 义 变量 的 例子 如 性 别 \ 省 份 : 职 业 等 ,有 
序 变量 的 例子 如 年 级 、 名 次 \ 年 龄 组 别 等 . 

1. factor( ) 函数 

因为 离散 型 变量 有 各 种 不 同 表 示 方 法 ,在 R 中 为 统一 起 见 使 用 因子 (fac- 
tor) 来 表示 这 种 分 类 变量 ,并 提供 了 有 序 因 子 (ordered factor) 来 表示 有 序 变 
量 .因子 是 一 种 特殊 的 向 量 ,其 中 每 一 个 元 素 取 一 组 离散 值 中 的 一 个 ,因子 对 
象 有 一 个 特殊 属性 levels 表示 这 组 离散 值 . 例如 : 

x=c(" 男 " ," 女 ", " 男 " ," 男 " ,'" 奖 + ) 

y=factor(x);y 

[1] 男 女 男 男女 

Levels: 男 女 

函数 factor( ) 用 来 把 一 个 向 量 编码 成 为 一 个 因子 ,其 一 般 形 式 为 


factor( x, levels = sort ( unique ( x) , na. last = TRUE ) labels, exclude = NA， 
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ordered = FALSE) 
可 以 用 来 指定 各 离散 取 值 (水 平 ) ,不 指定 时 由 x 的 不 同 值 来 求 得 . labels 用 来 
指定 各 水 平 的 标签 ,不 指定 时 用 各 离散 取 值 的 对 应 字符 串 . exclude 参数 用 来 
指定 要 转换 为 缺失 值 (NA) 的 元素 值 集合 . 如 果 指 定 了 levels , 则 因子 的 第 i 个 
元 素 等 于 水 平 中 第 j 个 元 素 时 ,元 素 值 取 j; 如 果 因 子 的 第 i 个 元 素 没有 出 现在 
levels 中 , 则 对 应 因子 元 素 值 取 NA. ordered 取 真 值 时 ,表示 因子 水 平 是 有 次 序 
的 ( 按 编码 次 序 ). 例 如: 
f <- factor(c(1,0,1,1,0), levels=c(1,0) ,labels=c(" 男 "," 女 ")) 

结果 和 前 面 的 一 样 . 

可 以 用 is. factor( ) 检验 对 象 是 否 为 因子 ,用 as. factor( ) 把 一 个 向 量 转换 
成 一 个 因子 . 因子 的 基本 统计 是 频数 统计 ,用 函数 table( ) 来 计数 .例如 : 

sex=factor(c(" 曙 二 2)) 

res. tab <— table( sex) 

> res. tab 

Sex 

男 女 

3 设 
表示 男性 3 人 ,女性 2 人 ,table( ) 的 结果 是 一 个 带 元 素 名 的 向 量 ,元 素 名 为 因 
子 水 平 ,元 素 值 为 该 水 平 出 现 的 频数 ， 

还 可 以 用 两 个 或 多 个 因子 进行 交叉 分 类 . 比如 ,性 别 (sex) 和 职业 (job) 交 
叉 分 组 ,可 以 用 table(sex,job) 来 统计 每 一 交叉 类 的 频数 ,结果 为 一 个 和 矩阵, 矩 
阵 带 有 行 名 和 列 名 ,分别 为 两 因子 的 各 水 平 名 . 

2. tapply ( ) 函数 

tapply( ) 函数 的 一 般 用 法 为 

tapply(x,INDEX ,FUN = NULL , ,simplify =TRUE ) 
x 是 一 对 象 ,通常 为 一 向 量 ,INDEX 是 与 x 有 同样 长 度 的 因子 ,FUN 是 要 计算 
的 函数 。 因 子 可 以 用 来 作为 男 外 的 同 长 度 变量 的 分 类 变量 .比如 ,假设 上 面 的 
sex 是 5 个 学 生 的 性 别 ,而 

h<-c(165 ,170 ,168 ,172 ,159 ) 
是 这 5 个 学 生 的 身高 ,而 

> tapply(h,sex,mean) 
可 以 求 按 性 别 分 类 的 身高 的 平均 值 : 

男 女 
168. 3333 164. 5000 
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这 样 用 一 个 等 长 的 因子 向 量 对 一 个 数值 向 量 分 组 的 办 法 称 为 不 规则 数组 
(ragged array ) . 

3. gl( ) 函数 

中 ( ) 函数 可 以 方便 地 产生 因子 ,一般 用 法 为 

gl(n,k,length=n * k,labels=1:n,odered=FALSE), 
n 为 水 平 数 ,k 为 重复 的 次 数 ,length 为 结果 的 长 度 ,labels 为 n 维 向 量 , 表 示 因 
子 水 平 ,ordered 是 逻辑 变量 ,表示 是 否 为 有 序 因子 , 缺 省 值 FALSE. 

>gl(2,3) 

[1] £1 22 

Levels: 1 2 

> 中 (2,1,6) 

[1] 121212 

Levels. 12 


2.5 列表 与 数据 框 


1; 列表 

列表 (list) 是 一 种 特别 的 对 象 集合 , 它 的 元 素 也 由 序号 (下 标 ) 区 分 ,但 是 
各 元 素 的 类 型 可 以 是 任意 对 象 ,不 同 元 素 不 必 是 同一 类 型 . 元 素 本 身 允 许 是 其 
他 复杂 数据 类 型 ,比如 ,列表 的 一 个 元 素 也 允许 是 一 个 列表 . 这 样 的 数据 类 型 
称 为 递归 (recursive) 数 据 类 型 -例如 : 

rec=list( name=" 黎 明 " ,age=30,score=c(85,76,90)); rec 

$ _ name 

[1] "黎明 

$ age 

[1] 30 

$ score 

[1] 85 76 90 
列表 元 素 可 以 用 “列表 名 [ [下 标 ]]” 的 格式 引用 . 例如 

rec[[2]] 

[1] 30 

rec[l [3]][2] 

[1] 76 
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但 是 ,列表 不 同 于 向 量 ,每 次 只 能 被 引用 一 个 元 素 , 如 rec[[1:2]] 的 用 法 是 不 
允许 的 . 

注 :“ 列 表 名 [下 标 ] ”或 “列表 名 [下 标 范围 ]” 也 是 合法 的 ,但 其 意义 与 用 
两 重 括号 的 记 法 完全 不 同 . 两 重 括号 的 记号 表示 取出 列表 的 一 个 元 素 ,结果 
与 该 元 素 类 型 相同 ;如果 使 用 一 重 括号 , 则 结果 为 列表 的 一 个 子 列表 (结果 类 
型 仍 为 列表 ) . 例如 : 

rec[2] 

$ age 

[1] 30 

在 定义 列表 时 如 果 指 定 了 元 素 的 名 字 ( 如 rec 中 的 name、age 和 scores)， 
则 引用 列表 元 素 还 可 以 引用 它 的 名 字 作 下 标 ,格式 为 “列表 名 [[ "元 素 
名 " ] ]”, 例 如 : 

rec[["age" ]] 
[1] 30 
另 一 种 格式 是 “列表 名 $ 元 素 名 ”, 例 如 : 
rec $ name 

[1] "黎明 " 
而 且 “ 元 素 名 ”还 可 以 简写 到 与 其 他 元 素 能 够 区 别 的 最 小 程度 . 比如 “rec 
$ s” 可 以 代表 “rec $ score”. 这 种 写法 方便 了 交互 运行 ,但 编写 程序 时 一 般 
不 用 简写 ,以 免 降 低 程序 的 可 读 性 . 

使 用 元 素 名 的 引用 方法 可 以 让 我 们 不 必 记 住 下 标 和 元 素 间 的 对 应 关系 ， 
而 直接 用 易 记 的 元 素 名 来 引用 元 素 . 事 实 上 ,向 量 和 和 抢 阵 也 可 以 指定 元 素 名 、 
行 名 和 列 名 . 

定义 列表 使 用 list( ) 函数 ,每 一 个 自 变 量变 成 列表 的 一 个 元 素 . 自 变量 可 
以 用 “名 字 = 值 ”的 方式 给 出 , 即 给 出 列表 元 素 名 . 自 变量 的 值 被 复制 到 列表 
元 素 中 . 自 变 量 如 果 是 变量 ,就 不 会 与 该 列表 元 素 建立 关系 (改变 该 列表 元 素 
不 会 改变 自 变 量 的 值 ). 

2. 修改 列表 

列表 的 元 素 可 以 修改 ,只 要 把 元 素 引用 赋值 即 可 ,例如 : 

rec $ age=45 
其 至 可 以 用 以 下 语句 修改 一 个 列表 元 素 : 

rec $ age <— list(19,29,31) 

如 果 被 赋值 的 元 素 原来 不 存在 , 则 列表 将 延伸 以 包含 这 个 新 元 素 . 例如 ， 
rec 现在 共有 三 个 元 素 ,如 果 定 义 一 个 新 的 命名 元 素 , 则 列表 长 度 变 为 4; 再 定 
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义 第 6 号 元 素 , 则 列表 长 度 变 为 6, 例 如: 

rec $ sex< 一 " 男 ” 

rec[ [6]] =161 

rec 

$ name 

[1] "黎明 ， 

$ age 

$ age[ [1]] 

[1] 19 

$ score 

[1] 85 76 90 

[[5]] 

NULL 

[£6]] 

[1] 161 

第 5 号 元 素 因为 没有 定义 ,所 以 值 是 “NULL”, 这 是 空 对 象 的 记号 . 如 果 
rec 是 一 个 向 量 , 则 其 空 对 象 为 “NA”, 这 是 缺失 值 的 记号 , 从 这 里 我 们 可 以 体 
会 “NULL” 与 “NA” 的 区 别 . 

几 个 列表 可 以 用 连接 函数 c( ) 连接 起 来 ,结果 仍 为 一 个 列表 ,其 元 素 为 各 
自 变量 的 列表 元 素 . 如 : 

list. A=list(name="wangming" ,age=31 ,weight=45) 

list. B = list ( school =" Qianjin xiao xue", address =" Wuhan", grade = 
"class3" ) 

list. AB=c( list. A ,list. B) 

注 :在 R 中 旬 点 是 名 字 的 合法 部 分 ,一般 没 有 特殊 意义 . 

3. 几 个 返回 到 列表 的 函数 


列表 的 重要 作用 是 把 相关 的 若干 数据 保存 在 一 个 数据 对 象 中 , 这 样 在 编 
写 函 数 时 我 们 就 可 以 返回 一 个 包含 多 项 输出 的 列表 . 因为 函数 的 返回 结果 可 
以 完整 地 存放 在 一 个 列表 中 ,我 们 可 以 继续 对 得 到 的 结果 进行 分 析 . 例如 : 

( 1 ) 特 征 值 和 特征 向 量 

函数 eigen(x) 对 对 称 和 矩阵 x 计算 其 特征 值 和 特征 向 量 ,返回 结果 为 一 个 
列表 . 列表 的 两 个 成 员 ( 元 素 ) 为 values 和 vectors. 例如 : 

ev=eigen((1:3)%o%(1:3)) 


> eV 
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$ values 
[1] 1.400000e+01 1.484923e-15 1.051986e-16 
$ vectors 

zl [ ,2] [ ,3] 


[1,] 0.2672612 0.0000000 0.9636241 
[2,] 0.5345225 -0.8320503 -0.1482499 
[3,] 0.8017837 0.5547002 _0.2223748 
可 见 三 个 特征 值 只 有 一 个 不 为 零 ( 由 于 数值 计算 精度 所 限 ,第 三 个 特征 值 应 
该 为 零 ,但 结果 只 是 近似 为 零 ) .特征 向 量 按 和 矩阵 存放 ,每 列 为 一 个 特征 向 量 . 
(让) 奇异 值 分 解 及 行列 式 
函数 svd( ) 进行 奇异 值 分 解 :下 = UDV', 其 中 半 是 任意 nn x m 和 矩阵 ,U 是 
n x n 正 交 阵 ,V 是 m x m 正 交 阵 ,D 是 n xm 对 角 阵 ( 只 有 主 对 角 线 元 素 大 于 
零 ). syd(X) 返 回 有 三 个 成 员 d,u,v 的 列表 ,d 为 包含 奇异 值 的 向 量 ( 即 D 的 
主 对 角 线 元 素 ) ,u,v 分别 为 上 面 的 两 个 正 交 和 矩阵 . 易 见 若 和 矩阵 立 是 方 阵 , 则 
其 行列 式 的 绝对 值 等 于 奇异 值 的 乘积 , 即 
absddetx = prod( svd(x) $ d) 
或 者 可 以 为 此 定义 一 个 函数 : 
absddet=function(x) prod(svd(x) $ d) 


例如 : 
>y=matrix(c(1,2,3,4,5,8,7,8,9) ,nrow=3,ncol=3) 
>eigen(y) 
$ values 
[1] 17.0369990 -1.5955539 -0.4414451 
$ vectors 
[st [ ,2] [ ,3] 


[1,] -0.4458227 -0.7803579 -0.92650459 

[2,] -0.5456677 -0:3725544 0.37552991 

[3,] -0.7095695 0.5022398 -0.02380202 

> det(y) 

[1] 12 

> prod(svd(y) $ d) 

[Li 12 

〈 正 )CR 分 解 

函数 qr(x) 返 回 x 的 CR 分解 .矩阵 互 的 CR 分 解 为 X=QR,Q 为 正 交 甜 
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阵 ,R 为 上 三 角 和 矩阵 . 函数 结果 为 一 个 列表 ,成员 gr 是 压缩 了 Q@ 入 在 内 的 
一 个 矩阵 ,@ 的 信息 压缩 存放 在 下 三 角 部 分 . 结果 中 的 其 他 成 员 为 一 些 辅助 信 
息 . 用 qr.Q() 和 dr.R(C) 可 以 从 qr() 的 结果 中 提取 QO 入. 
4. 数据 框 
数据 框 ( data. frame) 是 R 中 的 一 种 数据 结构 . 它 通 常 是 矩阵 形式 的 数据 ， 
但 矩阵 各 列 可 以 是 不 同类 型 的 . 而 数据 框 每 列 是 一 个 变量 ,每 行 是 一 个 观测 ， 
且 数 据 框 有 更 一 般 的 定义 : 它 是 一 种 特殊 的 列表 对 象 , 有 一 个 值 为 “data. 
frame "的 class 属性 ,各 列表 成 员 必 须 是 向 量 (数值 型 .字符 型 、 钦 辑 型 )、 因 子 、 
数值 型 矩阵 、 列 表 或 其 他 数据 框 . 向 量 、 因 子 成 员 为 数据 框 提 供 一 个 变量 ,如 果 
向 量 非 数值 型 , 则 会 被 强制 转换 为 因子 ,而 矩阵、 列表 、 数 据 框 这 样 的 成 员 为 新 
数据 框 提供 了 和 其 列 数 \ 成 员 数 、 变 量 数 相 同 个 数 的 变量 . 作为 数据 框 变量 的 
向 量 、 因 子 或 矩阵 必须 有 相同 的 长 度 ( 行 数 ). 
( i ) 数 据 框 生成 
数据 框 可 以 用 data. frame( ) 函数 生成 ,其 用 法 与 list( ) 函数 相同 ,对 各 自 
变量 数据 框 的 成 分 , 自 变量 可 以 命名 ,成 为 变量 名 . 例如 : 
> d=data. frame( name=c( "黎明 "," 张 聪 ", "王建 "),age=c(30,35 ,28)， 
height=c(180,172,177)) 
»-d 
name age height 
1 黎明 30 180 
2 张 聪 35 172 
3 王建 28 177 
如 果 一 个 列表 的 各 个 成 分 满足 数据 框 成 分 的 要 求 , 可 以 用 as. data. 
frame( ) 函数 将 其 强制 转换 为 数据 框 . 比如 ,上 面 的 d 如 果 先 用 list( ) 函数 定义 
为 一 个 列表 ,就 可 以 强制 转换 为 一 个 数据 框 . 
一 个 矩阵 可 以 用 data. frame( ) 转换 为 一 个 数据 框 , 如 果 它 原来 有 列 名 , 则 
其 列 名 被 作为 数据 框 的 变量 名 ,否则 系统 自动 为 数据 框 的 各 列 起 一 个 变量 名 . 
例如 : 
> M01 =matrix(c(1:6) ,nrow=3) 
> M01 
[,1] [,2] 
[要 1 4 
[入 多 3 
ee $$ 6 
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> data. frame( MO1 ) 


Xl X2 
1 1 4 
2 2 3 
B33 6 
(二 ) 数 据 框 引 用 


引用 数据 框 元 素 的 方法 与 引用 和 矩阵 元 素 的 方法 相同 ,可 以 使 用 下 标 或 下 
标 向 量 ,也 可 以 使 用 名 字 或 名 字 向 量 , 如 d[1:2,2:3]. 数据 框 的 各 变量 也 可 
以 按 列表 引用 ( 即 用 双 括 号 [[ ]] 或 $ 引 用 ). 

数据 框 的 变量 名 由 属性 name 定义 ,此 属性 一 定 是 非 空 的 . 数据 框 的 各 行 
也 可 以 定义 名 字 , 可 以 用 rownames 属性 定义 . 例如 : 

>names(d) 

[1] "name" "age" "height" 

>rownames( d) 

EE] 本 23 

( 道 )attach( ) 函数 

数据 框 的 主要 用 途 是 保存 统计 建 模 需 要 的 数据 . R 的 统计 建 模 功能 都 需 
要 用 数据 框 来 输入 数据 . 我 们 也 可 以 把 数据 框 当成 一 种 矩阵 来 处 理 .但 是 ,这 
样 使 用 较 麻烦 ,R 提供 了 attach( ) 函数 ,可 以 把 数据 框 “ 连 接 ” 人 当前 的 名 字 空 
间 . 例如 : 

>attach(d) 

>T= height/age; r 

[1] 6.000000 4.914286 6.321429 
后 一 语句 将 在 当前 工作 空间 建立 一 个 新 变量 r, 它 不 会 自动 进入 数据 框 d. 要 
把 新 变量 赋值 到 数据 框 中 ,可 以 用 如 下 格式 : 

>d $ r=height/age 

为 了 取消 链接 ;只 要 调用 detach() (无 参数 ) 即 可 ， 

注 :R 中 名 字 空 间 的 管理 是 比较 独特 的 . 它 在 运行 时 保持 一 个 变量 搜索 
路 径 表 ,在 读 取 某 个 变量 时 到 这 个 变量 搜索 路 径 表 中 由 前 向 后 查找 ,找到 最 前 
的 一 个 ;在 赋值 时 总 是 在 位 置 1 赋值 (除非 特别 指定 在 其 他 位 置 ). attach( ) 的 
默认 位 置 是 在 变量 搜索 路 径 表 的 位 置 2, detach( ) 的 默认 位 置 也 是 位 置 2. 

attach( ) 除了 用 来 连接 数据 框 也 可 以 用 来 连接 列表 . 

(iv ) 列 表 与 数据 框 的 编辑 

可 用 函数 edit( ) 对 列表 或 者 数据 框 进行 编辑 . 
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>newd=edit(d) 

会 出 现 一 个 数据 编辑 窗口 ,可 以 在 此 窗口 进行 编辑 。 当 然 也 可 对 向 量 、 数 
组 、 和 矩阵 类 型 的 数据 进行 修改 和 编辑 . 相 类 似 的 函数 还 有 fix( ). 

函数 merge(x, y,…) 可 以 将 两 个 数据 框 合并 成 一 个 数据 框 , 详 见 “帮助 ” 
中 的 说 明 。 

5. 追踪 对 象 的 函数 

函数 ls( ) 可 以 列 出 所 有 定义 过 的 变量 名 ,例如 : 

>]s( ) 

LI 

函数 str( 变量 名 ) 列 出 此 变量 名 的 类 型 和 数据 ,例如 : 

>sir( d) 

“data. frame': 3 obs. of 3 variables: 

$ name : Factor w/ 3 levels "黎明 "," 王 建 ",….:132 

$ age : num 30 35 28 

$ height: num 180 172 177 


2.6 输出 输入 


1. 输出 

在 R 交 互 运行 时 要 显示 某 一 个 对 象 的 值 只 要 键入 其 名 字 即 可 ,例如 : 

>x<-c(1:5); x 

切 环 E28 4:5 
这 实际 上 是 调用 了 print( ) 函数 , 即 print(x). 在 非 交 互 运 行 (程序 ) 中 应 使 用 
print( ) 来 输出 ,print( ) 函数 可 以 带 一 些 参数 :digits 指定 每 个 数 输出 的 有 效 数 
字 位 数 ,quote 指定 字符 串 输出 时 是 否 带 两 边 的 括号 ,print. gap 指定 矩阵 或 数 
组 输出 时 列 之 间 的 距离 . 

Print( ) 函数 是 一 个 通用 函数 , 即 它 对 不 同 的 自 变量 有 不 同 的 反应 : 对 各 
种 特殊 对 象 ( 如 数组 、 模 型 结果 等 ) 都 可 以 规定 print 的 输出 格式 . 

cat( ) 函数 也 用 来 输出 ,但 它 可 以 把 多 个 参数 连接 起 来 再 输出 (具有 类 似 
于 paste( ) 的 功能 ). 例如 : 

eat(C Mis in 

注意 使 用 cat( ) 时 要 加 上 换行 符 "\ n". 它 把 各 项 转换 成 字符 串 , 中 间 以 
空格 连接 起 来 ,然后 显示 . 如 果 要 使 用 自 定义 的 分 隔 符 ,可 以 用 sep = 参数 ， 
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例如 : 
>vat(c( "AB'Y,"e") cl ,PM ,sep=Y") 

ABcEF 

cat( ) 还 可 以 指定 一 个 参数 “fle= 文 件 名 ”, 把 结果 写 到 指定 的 文件 中 , 例 
如 : 

>cat("i=",1,"\n" ,file="c:/simR/result. txt" ) 
如 果 指 定 的 文件 已 经 存在 , 则 原来 内 容 被 覆盖 . 加 上 一 个 append=TRUE 参数 
可 以 不 覆盖 原文 件 而 是 在 原文 件 末尾 附加 ,这 非常 适用 于 运行 中 的 结果 记录 . 

cat( ) 函数 和 print( ) 函数 都 不 具有 很 强 的 自 定义 格式 功能 ,为 此 可 以 使 
用 cat( ) 函数 和 format( ) 函数 配合 实现 . format( ) 函数 为 一 个 数值 向 量 找到 一 
种 共同 的 显示 格式 ,然后 把 向 量 转换 为 字符 型 . 例如: 

> format(c(]1 ,1000 ,10000 ) ) 

[1 0096 "10000" 

R 还 提供 了 一 个 formatC 基 数 ,对 输入 向 量 的 每 一 个 元 素 单独 进行 格式 转 
换 而 不 生成 统一 格式 ,例如 : 

> formatC(c(1 ,1000 ,10000) ) 

[1] "1" "1000" "le+t04" 

在 formatC( ) 函数 中 可 以 用 format = 参数 指定 C 格式 类 型 ,如 d( 整 数 )、 
人 (定点 实数 ) 、e 或 E( 科 学 计数 法 ) 、g 或 G( 选 择 位 数 较 少 的 输出 格式 ) 、fg( 定 
点 实数 但 用 参数 digits 指定 有 效 位 数 而 不 是 总 宽度 ) 以 及 s( 字 符 串 ). 可 以 用 
width 指定 输出 宽度 ,用 digits 指定 有 效 位 数 ( 格 式 为 e.E、g、G 和 名 时 ) 或 小 
数 点 后 位 数 ( 格 式 为 f) 时 ,可 以 用 flag 参数 指定 一 个 输出 选项 字符 串 . 字符 串 
中 有 “-” 表 示 输 出 左 对 齐 , 有 “0” 表 示 左 空白 用 0 填充 ,有 “+” 表 示 要 输出 正 
负 号 ,等 等 . 例如: 

>formatC(1234. 12345 , digits =3 ,width = 10 ,format="f") 

[1]"1234. 123" 

R 的 输出 默认 显示 在 交互 窗口 .可 以 用 sink() 函 数 指定 一 个 文件 用 来 把 
后 续 输 出 转向 到 这 个 文件 ,并 可 以 用 append 参数 指定 是 否 要 在 文件 末尾 附 
加 : 

> sink("C:/simR/result. txt" ,append =TRUE) 

>ls() 

d 

>sink( ) 

调用 无 参数 的 sink( ) 把 输出 恢复 到 交互 窗口 . 
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如 果 要 把 矩阵 x 输出 到 文件 中 ,可 以 用 write(t(x) ,file=“ 文 件 名 ”,ncol= 
ncol(x) ) 的 形式 . 这 里 之 所 以 要 把 x 转 置 后 再 输出 是 因为 R 中 和 矩阵 是 列 优先 
的 . 如 果 不 转 置 , 则 按 列 输出 . 如 果 不 指定 列 数 , 则 默认 使 用 5 列 ,不管 x 的 列 
数 是 多 少 ,文件 名 默认 将 使 用 data. 

要 把 一 个 数据 框 d 输出 到 文件 中 ,可 用 write. table(x,file=" 文 件 名 " ) , 输 
出 文件 中 包含 变量 名 表 头 和 行 名 . 

2. 输入 

为 了 从 外 部 文件 读 入 一 个 数值 型 向 量 ,R 提供 了 scan( ) 函数 . 如 果 指 定 
了 file 参数 (也 是 第 一 个 参数 ) , 则 从 指定 文件 读 入 . 默认 情况 下 读 人 一 个 数值 
向 量 ,文件 中 各 数据 以 空白 分 隔 ,直到 读 完 文件 为 止 . 例如 : 

cat(1:12,'\n’ ,file='c:/simR/result01. txt’) 

x=scan( 'c:/simR/result01. txt’) 

如 果 文 件 中 是 一 个 用 空白 分 隔 的 矩阵 (数组 ) ,可 以 先 用 scan( ) 把 它 读 入 
到 一 个 向 量 ,然后 用 matrix( ) 函数 或 array( ) 函数 转换 . 例如 : 

>y=matrix(x,ncol=3,hyrow=T) 

实际 上 ,scan( ) 函数 也 能 够 读 人 一 个 多 列 的 表格 ,只 要 用 what 参数 指定 
一 个 列表 ,该 列表 每 项 的 类 型 为 需要 读 取 的 类 型 . 用 skip 参数 可 以 跳 过 文件 
的 开始 若干 行 不 读 . 用 sep 参数 可 以 指定 数据 间 的 分 隔 符 . 详 见 “帮助 ”文档 
中 的 说 明 . 

如 果 scan( ) 函数 不 指定 读 取 的 文件 名 , 则 是 交互 读 入 , 读 人 时 用 一 个 空 
行 结 束 : 

如 果 要 读 取 一 个 数据 框 ,R 提供 了 read. table( ) 函数 . 它 只 要 给 出 一 个 文 
件 名 ,就 可 以 把 文件 中 用 空白 分 隔 的 表格 数据 每 行 读 人 为 数据 框 的 一 行 . 例 
如 : 

w=read. table ('c:/simR/d. txt' ,colClass = ( 'character’, 'numeric’,’ charac- 


ter’ ) ) 


V1 V2 V3 
1 Zhou 15.0 3 
2 LiMing 9.0 黎明 
3 Zhang 10.2 Wang 


读 人 结果 为 数据 框 . 函数 自动 为 数据 框 变量 指定 V1 、V2 这 样 的 变量 名 ， 
指定 1、2 这 样 的 行 名 . 可 以 用 col. names 参数 指定 一 个 字符 型 向 量 作 为 数据 框 
的 变量 名 ,row. names 参数 指定 一 个 字符 型 向 量 作为 数据 框 的 行 名 . 函数 可 以 
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自动 识别 表 列 是 字符 型 还 是 数值 型 ,并 在 默认 情况 下 把 字符 型 数据 转化 为 因 
子 . 这 里 的 第 一 列 和 第 三 列 我 们 并 不 想 转换 ,所 以 人 为 地 加 上 了 一 个 eol- 
Classes 参数 ,说明 每 一 列 的 数据 类 型 . 

对 于 逗号 分 隔 的 文件 用 read. csv( ) 读 取 . 加 上 header=T 参数 可 以 读 和 人 
带 有 表 头 的 文件 . 例如 : 

> wl=read. csv('c:/simR/d. csv' ,header=T,colClass= c(' character' nu- 


meric character' ) ) 


>w 
V1 V2 V3 
1 Zhou 15.0 3 
2 Li Ming 9.0 黎明 
Zhang 10.2 Wang 


R 中 一 般 不 能 直接 读 xls 文件 ,可 先 转 换 为 csv 文件 ,再 用 函数 read. csv( ) 
读 取 ,或 者 利用 扩展 包 xlsReadWrite 中 的 函数 read. xls( ) 进行 读 取 。 

>library ( xlsReadWrite ) 

>d=read. xls( "foo. xls" ) 


其 他 一 些 用 法 见 R 的 “帮助 ”中 的 内 容 . 


2.7 程序 控制 结构 


R 是 一 个 表达 语言 ,其 任何 一 个 语句 都 可 以 看 成 是 一 个 表达 式 . 表达 式 之 
间 以 分 号 分 隔 或 用 换行 分 隔 . 表达 式 可 以 续 行 , 若 前 一 行 不 是 完整 的 表达 式 
(比如 末尾 是 加 减 乘除 等 运算 符 ,或 有 未 配对 的 括号 ) , 则 下 一 行为 上 一 行 的 
继续 . 
若干 个 表达 式 可 以 放 在 一 起 组 成 一 个 复合 表达 式 ,作为 一 个 表达 式 使 用 : 
组 合用 大 括号 表示 ,例如 : 
| 
x<— 15 
| 
R 也 提供 了 分 支 、 循 环 等 程序 控制 结构 . 
1. 分 支 结 构 
分 支 结 构 包 括 ff 结构: 
站 ( 条件) 表达 式 1 
46 





第 2 章 R 介 绍 * 





或 

这 (条 件 ) 表 达 式 1 else 表达 式 2 
其 中 “条件 "为 一 个 标量 的 真 值 或 假 值 ,表达 式 可 以 是 用 大 括号 包围 的 复合 表 
达 式 . 有 else 子 句 时 一 般 写成 : 

站 (条 件 ) | 
表达 式 组 
| else | 
表达 式 组 
| 

这 样 的 写法 可 以 使 else 不 至 于 脱离 前 面 的 if. 如 果 变 量 lambda 为 缺失 值 ,就 
给 它 赋 一 个 默认 值 , 即 ， 

if (is. na(lambda) )lambda<— 0.5 

若 要 计算 向 量 x 的 重 对 数 ,这 只 有 在 元 素 都 为 正 且 对 数 都 为 正 时 才能 做 
到 ,因此 需要 先 检 查 : 

if(all(x>0) &&all(log(x)>0) | 

y<- log(log(x)); 
print( cbind(x,y) ) ; 
| else | 
cat( ‘Unable to comply \ n’'); 
| 

注意 “&&” 表 示 “ 与 ”, 它 是 一 个 短路 运算 符 , 即 第 一 个 条 件 为 假 时 就 不 计 
算 第 二 个 条 件 . 如 果 不 这 样 ,此 例 中 计算 对 数 就 可 以 有 无 效 值 . 在 条 件 中 也 可 
以 用 ”| ”( 两 个 连续 的 竖 线 符号 ) 表 示 “ 或 ”" , 它 也 是 短路 运算 符 . 当 第 一 
件 为 真 时 就 不 需要 计算 第 二 个 条 件 . 

注 : 对 于 计算 重 对 数 的 问题 只 要 判断 all(x>1) 即 可 ,例子 是 为 了 说 明 短 路 
“与 ”. 

在 用 R 编程 时 一 定 要 牢记 R 是 一 个 向 量 语言 ,几乎 所 有 操作 都 是 对 向 量 
进行 的 .而 R 中 的 让 语句 却 是 一 个 少见 的 例外 , 它 的 判断 条 件 是 标量 的 真 值 
或 假 值 . 比如 ,我 们 要 定义 一 个 分 段 函 数 f(x), 当 x 为 正 时 返回 1, 否则 返回 
0, 马 上 可 以 想到 用 让 语句 实现 如 下 : 

if(x>0) 1 else 0 

当 自 变量 * 是 标量 时 ,这 个 定义 是 有 效 的 ;但 是 当 x 是 一 个 向 量 时 ,比较 

的 结果 也 是 一 个 向 量 , 这 时 条 件 无 法 使 用 ,所 以 这 个 分 段 函数 应 该 这 样 编程 : 


> w=matrix( ~10:4,ncol=5) 
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> y<- numeric( length(w)) 
>y[w>0] <- 1 
>y[w<=0]<=0 
>y 
[1]000000000001111 
有 多 个 让 语句 时 ,else 与 最 近 的 一 个 过 匹配 . 可 以 使 用 if… else if… else 
if.…else.… 的 多 重 判断 结构 表示 多 分 支 ， 多 分 支 也 可 以 使 用 swith( ) 函数 . 
2. 循环 结 构 
( 1 )for 循环 
循环 结构 中 常用 的 是 for 循环 ,是 对 一 个 向 量 或 列表 的 逐次 处 理 , 格 式 为 
for(name in values ) 表达 式 
例如 : 
>s<-0 
> for(i in seq(along=w)) | 
cat('‘w(',i, ')=',w[i], '\n’, sep=’ ') 
s<—stw[i] 
| 
我 们 在 这 个 例子 中 需要 下 标的 值 ,所 以 用 seq( along=w) 生 成 了 w 的 下 标 
向 量 . 如 果 不 需 要 下 标的 值 ,我 们 可 以 直接 如 此 使 用 : 
s<-0 
> for(wi in w) | 
cat(wi, '\n’) 
s=s+wi 
| 
当然 ,如 果 只 求 各 元 素 的 和 ,只 需 调用 sum(x) 即 可 . 从 这 里 我 们 可 以 看 
出 , 显 式 的 循环 经 常 是 可 以 避免 的 . 利用 函数 对 每 个 元 素 计 算 值 ,使 用 sum 等 
统计 函数 及 apply( ) ,lapply( ) ，sapply( ) ，tapply( ) 等 函数 可 以 代替 循环 因 
为 循环 在 R 中 是 很 慢 的 (R 是 解释 语言 ) ,所 以 应 尽 可 能 避免 使 用 显 式 的 循 
环 . 
我 们 再 举 一 个 例子 . 假设 一 共有 365 个 生日 (只 考虑 月 日 ) ,而 且 各 生日 
的 概率 是 相等 的 (这 里 忽略 了 半年 的 情况 以 及 可 能 存在 的 出 生日 期 分 布 的 不 
均匀 ) . 设 一 个 班 有 个 人 , 当 大 于 365 时 ,| 至少 有 两 个 人 生日 相同 | 是 必 
然 事件 . 当 n 小 于 或 等 于 365 时 ,我 们 可 以 计算 
P| 至 少 有 两 个 人 生日 相同 | =1-Pin 个 人 生日 彼此 不 同 | 
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这 时 个 人 的 生日 可 取 值 个 数 为 365” ,而 7 个 彼此 不 同 的 可 能 为 365 中 取 n 
个 的 一 个 排列 数 , 即 

365 x 364 x :… x (365 - (n -1)), 
因此 ,为 了 计算 n=1,2,…,365 的 情况 下 的 同 生日 概率 ,可 以 用 如 下 循环 实 
现 : 

> t<-numeric( 365 ) 

>for(n in 1:365) | 

t[n]<-1 

for(j in 0:(n-1))| ’ 
t[n]<- t[n] * (365-j)/365 #t[n] 为 n 个 人 生日 彼此 不 同 
| 
t[n]j<-1-t[n] 
| 

>t 

用 system. time(process) 可 查看 此 段 程序 的 运行 时 间 为 0. 980 秒 .我 们 还 
可 以 尽量 用 向 量 运 算 来 使 程序 运行 速度 更 快 : 

> t<-numeric(365 ) 

> for(nin 1:365) | 

t[n]<- 1-prod ((365:(365-n+1) )/365 ) 
| 

>t 

这 段 程序 只 用 了 0.030 秒 , 比 第 一 个 程序 快 327 倍 . 注意 不 能 直接 去 计算 
3651, 这 会 超出 数值 表示 范围 . 

这 个 问题 还 可 以 用 R 的 cumprod( ) 函数 进一步 简化 : 

x<- 1-cumprod((365:1)/365 ) 

这 段 程序 没有 任何 循环 ,运行 时 间 已 经 无 法 测量 . 多 次 重复 运行 可 以 发 
现 它 比 第 二 段 程序 快 165 倍 . 由 此 可 见 ,使 用 向 量 运算 以 及 利用 系统 提供 的 函 
数 可 以 有 效 提高 R 程序 的 效率 . 

另外 要 注意 ,使 用 for(iin 1:n) 格 式 的 计数 循环 时 要 避免 一 个 常见 的 错 
误 , 即 当 n 为 零 或 负数 时 ,1:n 是 一 个 从 大 到 小 的 循环 ,而 经 常 需要 的 是 当 n 
为 零 或 负数 时 就 不 进入 循环 . 为 达到 这 一 目的 ,可 以 在 循环 外 层 判 断 循环 结 
束 值 是 否 小 于 开始 值 . 

(ji )while 循环 
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while 循环 是 在 开始 处 判断 循环 条 件 的 当 型 循环 ,例如 : 
fnl = function(obs=10) | 
x =runif(obs) 
while( mean(x) < 0.45)| 
obs = 2 * obs 
x = runif( obs ) 
| 
list(mn=mean(x) ,std=sd(x) ,obs=obs) 
| 
是 一 个 需要 产生 多 少 个 均匀 随机 变量 才能 使 得 它们 的 均值 超过 0.45 的 函数 . 
输出 结果 为 均值 .标准 差 和 随机 变量 的 个 数 ,运行 得 到 结果 : 
>fnl() 
$ mn 
[1] 0.4757144 
$ std 
[1] 0.3377461 
$ obs 
[1] 20 
( 近 ) repeat 循环 
repeat 循环 结构 如 下 : 
repeat 表达 式 
在 循环 内 使 用 break 跳出 .在 一 个 循环 体内 用 next 表达 式 可 以 进入 下 一 
轮 循环 . 上 述 程序 中 的 while 循环 可 改写 成 repeat 循环 . 
fn2=function( obs=10) | 
repeat | 
x=runif( obs) 
if(mean(x) >= 0.45) break 
obs = 2 * obs 
} 
list( mn=mean(x) ,std=sd(x) ;obs=obs) 
| 
分 支 和 循环 结构 主要 用 于 定义 函数 ,详细 内 容 参 见 R“ 帮 助 ” 中 的 内 容 . 
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2.8 R 程 序 设计 


对 于 计算 较 复 杂 的 问题 我 们 只 有 通过 编写 程序 才能 解决 . 这 样 做 的 好 处 
是 一 次 编写 程序 可 以 重复 使 用 ,并 且 很 容易 修改 . 另 一 个 好 处 是 函数 内 的 变量 
名 是 局 部 的 ,运行 函数 不 会 使 函数 内 的 局 部 变量 被 保存 到 当前 工作 空间 ,可 以 
避免 在 交互 状态 下 直接 赋值 来 定义 很 多 变量 ,从 而 使 得 工作 空间 不 会 杂乱 无 
章 . 

1. 工 作 空 间 管 理 

前 面 我 们 已 经 提 到 ,R 在 运行 时 保持 一 个 变量 搜索 路 径 表 . 要 读 取 某 变 
量 时 依次 在 此 路 径 表 中 查找 ,返回 找到 的 第 一 个 ;给 变量 赋值 时 在 搜索 路 径 的 
第 一 个 位 置 赋值 ,被 赋值 的 变量 只 在 函数 运行 期 间 有 效 , 在 函数 外 部 ,搜索 路 
径 表 的 第 一 个 位 置 是 当前 空间 . 这 个 工作 空间 将 保存 所 有 在 函数 外 部 定义 的 
变量 以 及 函数 . 

这 样 ,因为 工作 空间 里 对 象 越 来 越 多 ,出错 的 机 会 就 增 大 了 . 尽量 把 工作 
都 用 函数 实现 可 以 避免 该 问题 ,函数 内 定义 的 变量 是 局 部 的 ,不 会 进入 当前 工 
作 空 间 . 

可 以 直接 管理 工作 空间 中 的 对 象 . 用 ls( ) 函数 可 以 查看 当前 工作 空间 保 
存 的 变量 和 函数 ,用 rm( ) 函数 可 以 剔除 不 想 要 的 对 象 . 例如 : 

St 
[1]"a" "absddet" "absdet. x" "beta" "cprodX" "d" 

ls( ) 可 以 指定 一 个 pattern 参数 ,此 参数 定义 一 个 匹配 模式 ,只 返回 符合 模式 
的 对 象 名 . 比如 ,ls(pattem="tmp[. ]" ) 可 返回 所 有 以 “tmp. ”开头 的 对 和 象 名 . 

m( ) 可 以 指定 一 个 名 为 list 的 参数 给 出 要 删除 的 对 象 名 . 比如 rm ( list= 
ls(pattern =" tmp[.]")) 可 以 删除 所 有 以 “tmp. ”开头 的 对 象 名 ,或 者 直接 用 
rm(list=]s( ) ) 可 删除 所 有 定义 过 的 变量 . 

2. 函数 定义 


R 中 函数 定义 的 一 般 格式 为 
函数 名 <- function( 参数 表 ) 表 达 式 
定义 函数 可 以 在 命令 行进 行 , 例 如 : 
> hello<-function( ) | 

cat("Hello, word! \n") 


cat("\n") 
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} 
函数 体 为 一 个 复合 表达 式 ,各 表达 式 之 间 用 换行 或 分 号 分 开 . 不 带 插 号 
调用 函数 时 显示 函数 定义 ,而 不 是 调用 函数 进行 运算 . 
在 命令 行 输入 函数 程序 时 修改 很 不 方便 ,所 以 我 们 一 般 是 打开 一 个 其 他 
的 编辑 程序 (如 “记事 本 ”), 输 入 所 需 函 数 定义 ,保存 文件 ,比如 保存 到 了 
c:\\simR\\xzh.r( 或 者 用 c:/simR/xzh.7) ,我 们 就 可 以 用 
source("c:\\simR\\xzh.r") 
运行 文件 中 的 程序 . 实际 上 ,用 source( ) 运行 的 程序 不 限于 函数 定义 ,任何 及 
程序 都 可 以 用 这 种 方式 编 好 后 再 运行 ,效果 与 在 命令 行 直接 输入 是 基本 相同 
的 ,只 不 过 不 自动 显示 表达 式 值 . 
对 于 一 个 已 有 定义 的 函数 ,可 以 用 fix( ) 函数 来 修改 ,例如 : 
fix(xzh) 
将 打开 一 个 编辑 窗口 显示 函数 的 定义 ,修改 后 关闭 窗口 就 可 以 了 . 
函数 可 以 带 参 数 ,可 以 返回 值 , 例 如 : 
> f01<- function(x,y) | 
Be Ry 
} 
R 返回 值 为 函数 体 的 最 后 一 个 表达 式 的 值 ,不 需要 使 用 retum( ) 函数 .不 
过 ,也 可 以 使 用 "returm( 对 象 ) "函数 从 函数 体 返 回调 用 者 . R 只 能 返回 一 个 对 
象 ,所 以 要 返回 多 个 结果 时 需要 用 一 个 列表 把 这 些 结果 包装 起 来 返回 . 
3. 参数 
R 函数 调用 的 方式 很 灵活 ,例如 ,函数 f01 有 两 个 参数 x 和 y, 用 这 个 函数 
计算 100-45 ,可 以 调用 f01(100,45) 或 f01(x=100,y=45) ,或 f01(y=45,x= 
100) ,或 f01(y=45,100) 等 .调用 时 实 参 与 虚 参 可 以 按 次 序 结合 ,也 可 以 直接 
指定 虚 参 名 结合 . 实 参 先 与 指定 了 名 字 的 虚 参 结合 ,没有 指定 名 字 的 按 次 序 与 
剩 下 的 虚 参 结合 . 
函数 在 调用 时 可 以 不 给 出 所 有 的 实 参 ,这 需要 在 定义 时 为 虚 参 指定 默认 
值 . 例 如 上 面 的 函数 改 为 
> f01<- function(x,y=0) x-y 
则 调用 时 除了 可 以 用 以 上 的 方式 调用 外 ,还 可 以 用 fo01(100) 、f01(x=100) 调 
用 ,只 给 出 没有 默认 值 的 实 参 . 
即使 没有 给 虚 参 指定 默认 值 ,也 可 以 在 调用 时 省 略 某 个 虚 参 ,然后 在 函数 
体内 用 missing( ) 函数 判断 此 虚 参 是 否 有 对 应 实 参 ,例如 : 
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> trans<- function(x,scale) | 


if(!| missing( scale) )x<—-x * scale 


| 

此 函数 在 给 出 了 scale 的 值 时 , 才 对 自 变量 x 乘 以 此 值 ,否则 自 变 量 x 保 
持原 值 . 这 种 用 法 在 其 他 语言 中 是 极 少见 的 . R 可 以 实现 这 一 点 ,是 因为 R 的 
函数 调用 在 用 到 参数 的 值 时 才 去 计算 这 个 参数 的 值 ( 称 为 “懒惰 求 值 ”) ,所 以 
可 以 在 调用 时 缺少 某 些 参数 而 不 被 拒绝 . 

4. 作用 域 

函数 的 虚 参 完全 是 按 值 传递 的 ,改变 虚 参 的 值 不 能 改变 对 应 实 参 的 值 . 
例如 : 

> x=list(1,"abc" ) 

> XxX 

[[1]] 

[Eo 

[[21] 

[11 "wer 

> f=function(x) {x[ [2]]="!!";x} 

> f(x) 

[[1]] 

[1] 1 

[[2]] 

[了 

函数 体内 的 变量 也 是 局 部 的 ,对 函数 体内 变量 的 赋值 ,在 函数 结束 运行 
后 ,这 些 值 就 被 删除 掉 了 ,不 影响 原来 同名 变量 的 值 . 例如 : 

> x<-2 

>f<- function() | 


print( x) 
x<- 20 
} 

> {() 

[1] 2 

> x 

[1] 2 
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这 个 例子 中 原来 有 一 个 变量 x 的 值 为 2, 函数 中 为 变量 x 赋值 20 ,但 函数 
运行 完 后 原来 的 x 值 并 未 变化 .但 也 要 注意 ,函数 中 显示 出 函数 调用 时 局 部 变 
量 x 还 没有 赋值 ,显示 的 是 全 局 变量 x 的 值 . 这 也 是 R 编程 中 容易 出 问题 的 地 
方 : 你 用 到 了 一 个 局 部 变量 的 值 , 但 没有 意识 到 这 个 局 部 变量 还 没有 赋值 ,而 
程序 却 没有 出 错 ,因为 这 个 变量 已 有 全 局 定义 . 

$5. 程序 调试 


对 任何 程序 语言 ,最 基本 的 调试 手段 当然 是 在 需要 的 地 方 显示 变量 的 值 . 
可 以 用 print( ) 或 cat( ) 显示 . 例如 ,为 了 调试 前 面 定义 的 f01( ) 函数 ( 当然, 这样 
简单 的 程序 实际 是 不 需要 调试 的 ) ,可 以 显示 两 个 变量 的 值 及 中 间 变 量 的 值 : 
> f01 =function(x,y) | 
cat('x= ',x,' \n’) 
cat('y= ',y,’'\n’) 
z=x-y 
cat('z= ', z,'\n’) 
| 
>f01(1,2) 
x= 1 
y= 2 
z= 一 | 
[1] -1 
R 提供 了 一 个 browser( ) 函数 , 当 调 用 该 函数 时 程序 暂停 . 可 以 用 ls( ) 列 
出 局 部 变量 ,用户 可 以 查看 变量 或 表达 式 的 值 , 还 可 以 修改 变量 . 例如 
> f01 =function(x,y) | 
browser( ) 
ZzZ=x—y 
z 
} 
> f01(11:12,1:3) 
Called from: f01(11:12, 1:3) 
Browse[1]>x 
[1] 11 12 
Browse[1]>y 
[和 1 艺 乌 
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Browse[1]>n 
debug: z <-x-y 
Browse[ 1 |] >z 
[1] 10 108 
Warning message : 
长 的 目标 对 象 长 度 不 是 短 的 目标 对 象 长 度 的 整 倍数 in:x-y 
程序 在 遇 到 browser( ) 调 用 时 进入 调试 状态 ,可 以 查看 其 中 的 局 部 变量 值 
(也 可 以 修改 ). 用 n 命令 可 以 单 步 跟 踪 运 行 ,在 第 一 次 用 n 命令 后 只 要 回 车 
就 继续 单 步 跟踪 运行 . 退出 R 的 browser( ) 菜 单 可 用 c. 用 9q 可 以 返回 到 命令 
R 提供 了 一 个 debug( ) 函数 ,debug(f01) 可 以 打开 f01( ) 函数 的 调试 . 执 
行 到 函数 f01 时 ,程序 自动 进入 单 步 执行 的 browser( ) 菜 单 , 回 车 就 可 以 单 步 
执行 .用 undebug(f01) 关闭 调试 . 
6. 程序 设计 举例 


设计 R 程序 是 很 容易 的 ,但 是 如 果 要 用 R 编制 计算 量 较 大 的 程序 ,或 者 
程序 需要 发 表 , 就 需要 注意 一 些 R 程序 设计 的 技巧 .用 R 语言 开发 算法 ,最 重 
要 的 一 点 要 记 住 R 是 一 个 向 量 语言 .计算 应 该 尽量 通过 向 量 、 和 矩阵 运算 来 进 
行 ,并 充分 利用 R 提供 的 现成 的 函数 ,避免 使 用 显示 循环 ,因为 R 是 解释 执行 
的 ,所 以 显示 循环 会 大 大 降低 R 的 运算 速度 : 

【 例 2.1】 考虑 某 银行 的 存 取 系统 . 设 open. account( ) 为 开户 函数 ， 
deposit( ) 为 存款 函数 ,withdraw( ) 为 取款 函数 ,balance( ) 为 存 取款 平衡 函数 . 
客户 的 存 取 过 程 如 下 : 

open. account=function(total) | 

list( 

deposit=function( amount, total ) | 

if(amount= =0) 

stop( " Deposits must be positivel \ n") 

total<<— total + amount 

cat( amount," deposited. your balance is", total,"\n \n") 
}, 

withdraw = function ( amount , total ) | 

if( amount > total) 

stop( "You don't have that much money! \n") 


total<<—total - amount 
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cat( amount," withdrawn. Your balance is" ,total,"\n \n") 
| ， 
balance=function(total ) | total= total 
cat( "Your balance is" ,total," \n\n" ) 
total | 
) 
| 
振 苦 薄 拓 基 基 大 藉 振 ## 基 振 持 打 藉 夫 少 打 坟 拓 兰 扩 拓 基 打 拓 基 共振 基 并 寺 扩 提 并 关 基 
>total = 100 
>ross = open. account( total ) 
>robert = open. account( 200) 
>ross $ withdraw(30) 
30 withdrawn. Your balance is 70 
>ross $ balance( ) 
Your balance is 70 
> robert $ balance( ) 
Your balance is 200 
> ross $ deposit(50) 
50 deposited. your balance is 120 
> ross $ balance( ) 
Your balance is 120 
> ross $ withdraw(500) 
错误 在 ross $ withdraw(500) : You don’t have that much money! 
【 例 2.2】 考虑 核 回 归 问 题 
核 回 归 是 非 参数 回归 的 一 种 ,假设 变量 了 与 变量 天 之 间 的 关系 为 
Y=f(X) + e， 
其 中 函数 了 未 知 ,观测 到 和 和 了 了 的 一 组 样本 : 
4 {2 
对 j 的 一 种 估计 为 








其 中 天 称 为 核 函 数 ,一 般 是 一 个 非 负 的 偶 函 数 ,原点 处 的 函数 值 最 大 ,在 两 侧 
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迅速 趋 于 零 . 例如 正 态 密 度 函 数 ,或 所 谓 双 三 次 函数 核 : 
ko- 人 ED jz| 过 二, 
0， 其 他 : 
R 中 的 函数 density( ) 可 以 进行 核 回归 估计 ,我 们 对 这 个 算法 进行 编程 . 首先 
编写 双 三 次 核 函数 的 程序 : 
kernel. dcube=function(u) | 
y=numeric( length( u)) 
ylabs(u)<1]=(1-abs(u[abs(u)<1])* *3)* *3 
y[abs(u)>=1]=0 
如 
| 
注意 ,上 面 的 分 段 函数 不 用 if 语句 而 是 采用 人 逻辑 向 量 作为 下 标的 办 法 . 
这 样 定义 出 的 函数 允许 以 向 量 和 数组 作 自 变量 . 
假设 要 画 出 核 估计 曲线 ,一般 取 一 个 范围 与 各 X, 范围 相同 的 等 间距 向 量 
+, 然后 计算 估计 出 的 Ax) 的 值 . 设 观测 数据 自 变 量 保存 在 向 量 X 中 , 因 变量 
保存 在 向 量 Y 中 , 则 可 以 写成 下 面 的 程序 : 
kernel. smoothl =function( X,Y ,kernel = kernel. dcube,h=1,m=100, 
plot. it=T) 1: 
x=seq(min(X) ,max(X),length=m) 
fx<— numeric( m) 
for(j in 1:m){# 计 算 第 j 个 等 间距 点 的 回归 函数 估计 值 
fx[j]<— sum(kermnel( (x[j]-X)/h) * Y)/ sum(kernel ((x[j]- 
X)/h) ) 
| 
这 (plot. it) 人， # 计 (plotit) 可 以 不 要 
plot(X,Y,type="p") 
lines(x,f{x) 
| 
cbind(x=x, 低 = 人 fx) 
| 
注意 ,上 面 的 程序 中 用 了 sum 函数 来 避免 一 重 对 i 的 循环 ,但 是 上 面 的 写 
法 中 仍 有 一 重 对 j 的 循环 ,使 得 程序 运行 较 慢 . 如 何 改 写 程序 ,把 这 个 循环 也 
取消 呢 ? 方法 是 把 计算 看 成 是 矩阵 运算 . 首先 ,如 果 x 是 一 个 标量 , 则 fx) 可 
以 改写 成 : 
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开 。 了 
f(x) = 


其 中 天 = K(<=) 是 一 个 与 六 长度 相等 ( 即 长 度 为 n) 的 行 向 量 ,1 是 一 列 1. 
现在 ,x 实际 上 是 一 个 长 度 为 m 的 向 量 ,对 x 的 每 一 个 元 素 可 以 计算 一 个 长 度 
为 n 的 行 向 量 x(A -9 . 把 这 些 行 向 量 上 下 合并 为 一 个 矩阵 K(m x n) ， 


则 KY 是 长 度 为 m 的 向 量 ,每 一 个 元 素 对 应 于 一 个 x[ 川 . 合并 的 矩阵 可 以 用 有 
的 outer( ) 函数 来 计算 : 

>?=function(u,v,kermnel,h) kernel( (u-v)/h) 

>K=outer(x,X,f,kerne]=kermnel,h=h) # outer( ) 的 第 一 个 自 变量 对 应 于 
结果 矩阵 的 行 ,第 二 个 自 变量 对 应 于 列 

在 分 母 中 ,为 了 计算 每 一 行 的 和 ,只 要 对 天 右 乘 1, 于 是 结果 的 估计 值 向 
量 为 

fx=c((K% * %Y)/(K % *% matrix(1,ncol=1,nrow=length(Y)))) 

这 样 修改 kernel. smooth1 ,就 可 以 得 到 更 精简 的 函数 kernel. smooth2. 

核 回 归 中 窗 宽 大 的 选择 是 比较 难 的 . 我 们 编写 的 核 回 归 函 数 应 该 允许 用 户 
输入 为 一 个 向 量 .对 向 量 中 每 一 个 窗 宽 计算 一 条 拟 合 曲 线 并 画 在 图 中 ,结果 作 
为 函数 返回 值 的 一 列 . 读者 可 以 作为 练习 实现 这 个 函数 ,并 模拟 X 和 YY 的 观测 ， 
然后 画 核 估计 曲线 , f(x) 用 sin(x) ,对 我 们 可 能 必须 用 循环 来 处 理 . 


2.9 图 形 


1. 常 用 图 形 
R 有 很 强 的 绘图 功能 ,通过 简单 的 函数 调用 ,就 可 迅速 作出 数据 的 各 种 图 
形 .在 熟悉 了 R 的 图 形 技术 之 后 ,也 可 以 设 定 许多 图 形 选 项 来 按 自己 的 要 求 
定制 图 形 . R 的 另 一 个 特色 是 绘图 函数 对 不 同 的 数据 对 象 可 以 作出 不 同 的 图 
形 .例如 ,假设 数据 文件 class. txt 存储 在 目录 c:/simR/ 下 .用 
cl<— read. table("c:/simR/class. txt" ， 
col. names=c("Name" ,"Sex","Age" ," Height" ," Weight" ) ) 


李 丽 下 13 148 41 王菲 F 187' 150.… 省 
胡 敏 ”下 14 151 44 李 艳 F 14 149 43 
马莉 下 12 143 40 刘 玲 F 13 146 43 


58 





a 


朱 彤 -下 12 142， 140 陈 美玲 BisW GyisHlM8dg <41 
陈 匠 “下 13 150 46 ” 刘 劲 Mrigis M4 = dllS0" wiz4g 
王峰 "M “113 “151“” “4900 李 明 MF 竺 乞 2 六 秽 半 6 轩 癌 稳 
陈 凯 M 13 148 50 张强 VM- -9 ~ -50 
张 筋 -=>M2 “143” 1514 ， 介 局 寺 畏 胰 pei dr J oS ~ 55 
蒜 亩 14. -155 0 


汪 平 M 1 148 48 
再 用 命令 attach(cl) ;plot( Height) ;plot( Sex) 分 别 绘 制 Height 的 散 点 图 和 Sex 
的 频数 条 形 图 (图 2-4) .我们 还 可 用 plot( ) 绘 制 两 个 变量 x 与 y 的 散 点 图 . 例 
如 绘制 Height 对 Weight 的 散 点 图 (图 2-5). 





3 10 15 
Index 


图 2-4 Height 散 点 图 和 Sex 频数 图 


Regression of Height on Weight 





142 144 146 148 150 152 154 
Height 


图 2-5 Height 对 Weight 的 散 点 图 
59 





”统计 模拟 及 其 R 实现 





> plot ( Height, Weight, main = " Regression of Height on Weight" , xlab = 
" Height" , ylab=" Weight" ) 
为 了 绘制 连 线 图 ,只 需 在 plot( ) 函数 中 加 type="1" 选项. 例如 用 命令 
>x=0:50 
>plot(x,dchisq(x,10) ,type="1") 
画 出 自由 度 为 10 的 x 分 布 密度 函数 图 (图 2-6). 


0.10 


0.08 


0 10 20 30 40 50 
x 


图 2-6” 自 由 度 为 10 的 x 分 布 密度 函数 图 


也 可 以 绘制 变量 的 荃 叶 图 . 调用 命令 
>stem( Height) 
可 以 画 出 图 2-7. 


The decimal point is 1 digit(s) to the right of the | 
14 | 233 
14 | 66888999 
15 | 0001113 
15 | 5 
图 2-7 Height 的 葵 叶 图 


绘制 一 个 变量 的 箱 型 图 . 调用 命令 
>boxplot ( Weight) 
可 以 画 出 图 2-8. 
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图 2-8 体重 的 箱 型 图 


也 可 以 绘制 几 个 变量 并 排 的 箱 型 图 . 比如 先 计算 Weight 对 Height 的 回 
归 ,把 拟 合 结果 存 人 pl1 ,然后 绘制 并 排 盒 形 图 . 

>fitl =lm( 允 eight ~ Height) 

>pl =predict(fitl ,cl ) ;pl 

>boxplot( lisi(" Weight" = Weight," Predict" =pl) ) 
结果 见 图 2-9. 





Weight Predict 


图 2-9 体重 及 其 预报 箱 型 图 


用 hist( ) 函数 可 以 绘制 直方 图 ,例如 . 
>hist( Weight) 
结果 见 图 2-10. 
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Histogram of Weight 
8 
6 
> 
吕 
vb 
2..4 
[2 
号 
2 
0 
证 
40 45 50 55 60 
Weight 


图 2-10 体重 的 直方 图 


用 qqnorm( ) 函数 可 以 绘制 正 态 Q-Q 图 ,如 : 
> qqnorm( Weight) 
> qqline( Weight,col=" red") 

结果 见 图 2-11. 


Normal Q-Q Plot 


Sample Quantiles 





”Theoretical Quantiles 


图 2-11 体重 的 正 态 Q-Q 
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2. 高 级 图 形 函 数 

R 的 图 形 函 数 分 为 两 类 :高 级 图 形 函 数 一 一 直接 绘制 图 形 并 可 自动 生成 
坐标 轴 等 附属 图 形 元 素 ; 低 级 图 形 函 数 可 以 修改 已 有 的 图 形 或 者 为 绘图 
规定 一 些 选 项 . 高 级 图 形 函 数 总 是 以 一 个 新 图 开始 . 下 面 介绍 常用 的 高 级 图 形 
函数 ,以 及 用 来 修饰 这 些 高 级 图 形 函 数 的 常用 可 选 参数 . 

最 常用 的 是 plot( ) 函数 . 比如 plot(x,y) (其 中 x,y 是 向 量 ) 对 两 个 变量 画 
散 点 图 :如 果 z 是 二 个 定义 了 x 变量 和 了 变量 的 列表 或 者 二 个 两 列 的 矩阵 , 则 
用 plot(z) 也 可 以 画 散 点 图 . 如 果 x 是 二 个 时 间 序 列 对 象 ( 时 间 序 列 对 象 用 
ts( ) 函数 生成 ) , 则 plot(x) 绘 制 时 间 序 列 曲线 图 . 如 果 x 是 一 个 普通 向 量 , 则 
绘制 x 的 值 对 其 下 标的 散 点 图 . 如 果 x 是 一 个 复数 向 量 , 则 绘制 虚 部 对 实 部 的 
散 点 图 . 如 果 f 是 一 个 因子 , 则 plot(f) 绘制 { 的 条 形 图 (每 个 因子 水 平 的 个 
数 ). 如 果 f 是 一 个 因子 ,y 是 长 度 相同 的 数值 向 量 , 则 plot(f,y) 对 上 的 每 一 个 
水 平 绘制 y 中 相应 数值 的 盒 形 图 . 如 果 d 只 是 一 个 数值 型 数据 的 数据 框 , 则 
plot(d) 对 d 的 每 两 个 变量 之 间作 图 ( 散 点 图 等 ). 

如 果 X 是 一 个 数值 型 矩阵 或 数据 框 , 则 用 plot(X) 可 以 绘制 每 两 列 之 间 
的 散 点 图 和 矩阵, 这 样 变 量 个 数 不 太 多 时 ,可 以 同时 看 到 多 个 变量 之 间 的 两 两 关 
系 ;变量 个 数 太 多 时 , 则 每 个 图 太 小 ;意义 不 大 . 

协同 图 ( coplot) 是 一 种 多 变量 探索 性 分 析 图 形 ; 其 形式 为 coplot(y ~ 
x |z) ,其 中 x 和 y 是 数值 型 向 量 ,z 是 同 长 度 的 因子 . 对 z 的 每 一 水 平 绘制 相 
应 组 的 x 和 y 的 散 点 图 . 例如 : 

coplot( Weight ~ Height | Sex) 

结果 见 图 2-12 ,对 不 同性 别 分 别 绘制 了 体重 对 身高 的 散 点 图 .如果 z 是 一 个 数 
值 型 变量 , 则 coplot( ) 先 对 z 的 取 值 分 组 ,然后 对 z 的 每 一 组 取 值 分 别 绘图 . 其 
至 可 以 用 如 coplot(y ~x| xl+x2) 表 示 对 xl 和 x2 的 每 一 水 平 组 合 绘图 . 
coplot( ) 和 pairs( ) 函数 默认 绘制 散 点 图 ,但 可 以 用 一 个 panel 参数 指定 其 他 的 
低级 绘图 函数 ,如 lines、panel、smooth 等 . 

qqnorm(x) .qqline(x) 、qqplot(x,y) 作 分 位 数 一 分 位 数 图 . qqnorm(x) 对 向 
量 x 作 正 态 概率 ( 纵 轴 为 次 序 统计 量 , 横 轴 为 对 应 该 次 序 统计 量 的 标准 正 态 分 
布 分 位 数 ). qqline(x) 在 qqnorm(x) 图 上 画 一 条 拟 合 曲线 . qqplot(x,y) 把 x 和 
y 的 次 序 统计 量 分 别 画 在 x 轴 和 y 轴 上 以 比较 这 两 个 变量 的 分 布 . 

hist(x) 作 向 量 x 的 直方 图 . 默认 时 自动 确定 分 组 ,也 可 以 用 nclass 参数 指 
定 分 组 个 数 ,或 者 用 breaks 参数 指定 一 个 分 组 点 向 量 . 如 果 指 定 了 prob =T, 则 
纵 轴 显示 密度 估计 . 

R 也 可 以 作 三 维 图 .等 值 线 图 和 等 值 色 图 ,相应 的 函数 分 别 为 persp( )、 
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Given:Sex 





142 144 146 148 150 152 154 











142 144 146 148 150 152 154 
Height 
图 2-12 不 同性 别 的 体重 对 身高 的 散 点 图 


contour( ) 和 image( ) ,例如 : 
>x=seq( -3,3,length = 100) 
>y=Xx 
>f=function(x,y,ssql =1,ssq2=2,rho=0.5) | 
detl =ssql * ssq2 * (1-rho’2) 


到 


sl =sqrt( ssql ) 
s2=sqrt( ssq2) 
17(2¥ pix sqit(detl)) wexp(=0:57ydetl * (ssq2 * x2+ssql 7 2 
-2*rho*sl *s2*y)) 

| 

>z=outer( x,y,f) 

>persp(x,y,z) 

>contour(x,y,z) 

>image(x,y,z) 

结果 见 图 2-13. 
64 











oa 


有 





图 2-13 三 维 图 .等 值 线 图 和 等 值 色 图 


3. 高 级 图 形 函 数 的 常用 选项 
高 级 图 形 函 数 有 一 些 共 同 的 选项 ,作为 函数 的 可 选 参数 ( 自 变量 ): 例如 : 
plot(x,main=" Graph of x" ) 
其 中 的 main 就 是 一 个 可 选 参数 ,用 来 指定 图 形 的 标题 . 没有 此 选项 图 形 就 没 
有 标题 . 表 2-1 列 出 了 这 样 的 选项 . 











表 2-1 高 级 图 形 选 项 

0 使 函数 像 低 级 图 形 函 数 那样 ,不 是 绘制 一 个 新 图 形 而 是 在 原 图 
基础 上 添加 

i 暂 不 画 坐 标 轴 , 随 后 可 以 用 axis( ) 函数 更 精确 地 规定 坐标 轴 的 
画 法 . 默认 值 是 axes=T, 即 有 坐标 轴 

log=“x” 用 对 数 刻度 绘制 x 轴 、y 轴 

log=“y” 

log=“xy” 

type= 规定 绘画 方式 

type=“p” 绘 点 

type=“1” 绘 线 

type=“b” 绘 点 并 在 之 间 用 线 连接 

type=“0o” 绘 点 并 画 线 穿 过 各 点 

type=“h” 从 点 到 横 轴 画 垂 线 

type=“s” 阶梯 函数 : 左 连续 

type=“S” 阶梯 函数 : 右 连续 

type=“n” 不 画 任何 点 、 线 ,但 仍 画 坐标 轴 并 建立 坐标 系 ,适用 于 后 面 介 绍 
的 用 低级 图 形 函 数 作 图 

xlab= "字符 串 ” 定义 x 轴 和 y 轴 的 标签 .默认 时 使 用 对 象 名 

ylab= “字符 串 ” 

main= “字符 串 ” 图 形 的 标题 

sub= “字符 串 ” 图 形 的 小 标题 ,用 较 小 字体 画 在 x 轴 下 方 
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4. 低级 图 形 函 数 


高 级 图 形 函 数 可 以 迅速 简便 地 绘制 常见 类 型 的 图 形 ,但 是 , 某 些 情况 下 可 
能 希望 绘制 一 些 有 特殊 要 求 的 图 形 . 比如 ,希望 按照 自己 的 设计 绘制 坐标 轴 ， 
在 已 有 的 图 上 增加 男 一 组 数据 ,在 图 中 加 入 一 行文 本 注释 , 绘 出 多 条 曲线 代表 
的 数据 的 标签 ,等 等 .低级 图 形 函 数 可 以 在 已 有 图 的 基础 上 进行 添加 : 

表 2-2 列 出 了 常用 的 低级 图 形 函 数 . 低级 图 形 函 数 一 般 需要 指定 位 置信 
息 ,其 中 的 坐标 指 的 是 用 户 坐 标 , 即 前 面 的 高 级 图 形 函 数 所 建立 的 坐标 系 中 的 
坐标 . 坐标 可 以 用 两 个 向 量 x 和 y 给 出 ,也 可 以 由 一 个 两 列 的 矩阵 给 出 . 如 果 
交互 作 图 , 则 可 以 用 下 面 介绍 的 locator( ) 函数 来 交互 地 从 图 形 中 直接 输入 坐 
标 位 置 . 


表 2-2 低级 图 形 函 数 












在 当前 图 形 上 从 加 一 组 点 或 线 . 可 以 使 用 plot( ) 的 type 参数 来 
指定 绘制 方式 ,默认 时 points( ) 画 点 ,lines( ) 画 线 
rug(x) 在 x 轴 上 用 一 些 短 刻度 线 表示 观测 函数 的 x 数值 . mg(x， 
side=2) 可 以 把 观测 的 短线 画 在 y 轴 上 
在 坐标 x 和 y 给 出 的 位 置 标 出 由 labels 指定 的 字符 串 . labels 可 
以 是 数值 型 或 字符 型 的 向 量 ,labels[i] 在 x[i] 和 y[ 让 标 出 

按 向 量 x 给 出 的 横 坐 标 和 向 量 y 给 出 的 纵 坐 标 确定 顶点 ,绘制 
多 边 形 . 可 以 用 col 参数 指定 用 某 种 颜色 填充 多 边 形 内 部 


abline( a,b) | 在 当前 图 形 上 画 一 条 直线 . 两 个 参数 a、b 分 别 给 出 截 距 和 斜率 . 
abline( h=y) 指定 h 参数 时 绘制 水 平 线 ,指定 v 参数 时 绘制 垂直 线 . 以 一 个 最 


points(x,y) 
lines(x,y) 










rug( x) 





rug( x,side=2) 


text(x,y,labels ……) 








polygon(x,y,.…) 








abline( v=x) 小 二 乘 拟 合 结果 lm. obj 作为 参数 时 ,由 lm. obj 的 coefficient 成 
abline( lm. obj) 员 给 出 直线 的 截 距 和 斜率 

legend(x,y， legend 函数 用 来 在 当前 图 形 的 指定 坐标 位 置 绘制 图 例 . 图 例 的 
legend,… ) 说 明文 字 由 向 量 legend 提供 . 至 少 要 给 出 下 面 的 v 值 以 确定 要 





对 什么 图 例 进行 说 明 ,Vv 是 长 度 与 legend 相同 的 向 量 
legend( ,angle=v) angle 参数 指定 几 种 阴影 斜 度 
legend( ,density=v) density 参数 指定 几 种 阴影 密度 


legend( ,fill=v) fill 参数 指定 几 种 填充 颜色 
legend( ,col=v) col 参数 指定 几 种 颜色 
legend(, lty=v) lty 参数 指定 几 种 线 型 


legend( pch=v) pch 参数 指定 几 种 散 点 符号 ,为 字符 型 向 量 
legend( , vect=v) vect 参数 也 指定 几 种 散 点 符号 ,为 字符 型 向 量 
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续 表 










绘制 由 main 指定 的 标题 和 由 sub 指定 的 小 标题 


绘制 一 个 坐标 轴 . 之 前 的 绘图 函数 必须 已 经 用 axes= 了 选项 抑制 
了 自动 的 坐标 轴 . 参数 side 指定 在 哪 一 边 绘制 坐标 轴 , 取 值 为 
到 4,1 为 下 边 , 然 后 道 时 针 数 .可 以 用 at 参 数 指定 位 置 ,用 labels 
参数 指定 刻度 处 的 标签 


title( main ,sub ) 





axis(side,… ) 


5. 交互 图 形 函 数 


R 的 低级 图 形 函 数 可 以 在 已 有 图 形 基础 上 添加 新 内 容 , 另 外 ,R 还 提供 了 两 
个 函数 locator( ) 和 identify( ) ,可 以 让 用 户 通过 在 图 中 点 击 鼠 标 来 确定 位 置 . 

函数 locator(n ,type) 运行 时 会 停 下 来 等 待 用 户 在 图 中 点 击 ,然后 返回 图 
形 中 鼠标 点 击 的 位 置 的 坐标 . 等 待 时 点 击 鼠 标 右键 可 以 选择 停止 等 待 ,立即 返 
回 .参数 n 指定 点 击 多 少 次 后 自动 停止 ,默认 为 500 次 ;如 果 使 用 参数 type, 则 
可 指定 绘 点 类 型 ,与 plot( ) 函数 中 的 type 参数 用 法 相同 ,在 鼠标 点 击 处 绘 点 
( 线 、 垂 线 , 等 等 ). locator( ) 返 回 值 是 一 个 列表 ,有 两 个 变量 (元 素 )x 和 ,分 
别 保存 点 击 位 置 的 横 坐 标 和 纵 坐 标 . 

例如 ,为 了 在 已 经 绘制 的 曲线 图 中 找 一 个 空白 处 标 上 一 行文 本 ,只 需 使 用 
如 下 程序 : 

> text( locator( 1 ) ," Normal density" ,adj=0) 

text( ) 半数 的 adj 参数 用 一 个 数字 表示 文本 串 相 对 于 给 定 的 坐标 的 画 法 ， 
adj=0 表示 给 定 坐 标 为 文本 串 左 侧 的 坐标 ,adj=1 表示 给 定 坐标 为 文本 串 右 
侧 的 坐标 ,adj=0.5 表示 给 定 坐 标 为 文本 串 中 间 的 坐标 . 

函数 (x,y,labels) 在 运行 时 会 停 下 来 等 待 用 户 点 击 , 待 用 户 点 击 后 ,返回 
用 户 在 图 形 中 点 击 的 点 的 序号 ,点 击 时 对 点 击 的 点 加 标签 .参数 x 和 y 给 出 要 
识别 的 各 个 点 的 坐标 labels 参数 指定 点 击 某 个 点 时 要 在 旁边 绘制 文本 标签 ， 
默认 时 标 出 此 点 的 序号 . 如 果 只 需要 返回 值 而 不 想 画 任何 标记 , 则 可 以 在 调用 
此 函数 时 加 一 个 参数 plot =F 参数 . 

注意 ,locator( ) 与 identify( ) 不同 ,locator( ) 返 回 图 中 任意 点 击 位 置 的 坐 
标 ,而 identify( ) 只 返回 离 点 击 位 置 最 近 的 点 的 序号 . 

例如 ,我 们 在 向 量 x 和 y 中 有 若干 个 点 的 坐标 ,运行 程序 如 下 : 

>plot(x,y) 

>identify( x,y) 
这 时 显示 转移 到 图 形 窗口 ,进入 等 待 状态 . 用 户 可 以 点 击 图 中 特别 的 点 ,该 点 
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的 序号 就 会 在 旁边 标 出 . 只 要 单 击 右键 并 选择 停止 ,就 可 以 结束 运行 . 返回 
果 为 所 点 击 的 各 个 点 的 序号 . 
6. 图 形 参数 的 使 用 
前 面 我 们 已 经 看 到 用 main、xlab、ylab 等 参数 来 规定 高 级 图 形 函 数 的 一 些 
设置 ;在 实际 绘图 中 ;特别 是 绘制 用 于 演示 或 出 版 的 图 形 时 ,用 R 默认 设置 绘 
制 的 图 形 往往 不 能 满足 要 求 . R 提供 了 一 系列 图 形 参 数 , 通 过 使 用 图 形 参数 可 
以 修改 图 形 显示 的 、 所 有 各 方面 的 设置 . 图 形 参数 包括 线 型 颜色 、 图 形 排列 、 
文本 对 齐 方式 等 各 种 设置 . 每 个 图 形 参 数 有 一 个 名 字 , 比 如 col 代表 颜色 ， 
col="red" 表示 红色 . 每 个 图 形 设备 有 一 套 单 独 的 图 形 参数 . 
设置 图 形 参数 分 为 两 种 ,长 效 设置 与 临时 设置 . 长 效 设置 使 用 par( ) 函数 
进行 设置 ,设置 后 在 退出 前 一 直 保 持 有 效 ; 临 时 设置 则 是 在 图 形 函 数 中 加 入 图 
形 参数 ,如 上 面 例子 中 的 adj 参数 : 
text( locator( 1) ," Normal density" ,adj=0) 
par( ) 函数 用 来 访问 或 修改 当前 图 形 设 备 的 图 形 参 数 . 如 果 不 带 参数 调 
用 ,例如 : 
par( )# 显 示 如 下 结果 
$ xlog 
[1] FALSE 
$ ylog 
[1] FALSE 
$ adj 
[1] 0.5 
$ ann 
[1] TRUE 
结果 为 一 个 列表 ,列表 的 各 元 素 名 为 图 形 参 数 名 ,元 素 值 为 相应 图 形 参 数 的 取 
值 . 如 果 调 用 时 指定 一 个 图 形 参数 名 的 向 量 作为 参数 , 则 只 返回 被 指定 的 图 形 
参数 的 列表 : 
>par(c("col","lty" )) 
$ col 
[1] "black" 
$ lty 
[1] "solid" 
调用 时 指定 名 字 为 图 形 参数 的 有 名 参数 , 则 修改 指定 的 图 形 参数 ,并 返回 
原 值 的 列表 : 
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>oldpar=par( col=4, lty=2) 

> oldpar 

$ col 

[1] "black" 

$ lty 

[1] "solid" 

因为 用 par( ) 修 改 图 形 参 数 是 保持 到 退出 以 前 都 有 效 的 ,而 且 即 使 是 在 
函数 内 部 此 修改 仍 是 全 局 的 ,所 以 我 们 通常 利用 如 下 方法 ,在 完成 任务 后 恢复 
原来 的 图 形 参数 : 

oldpar =par(col=4,lty=2) 

si (需要 修改 图 形 参 数 的 绘图 任务 ) 

par( oldpar)# 恢 复原 始 的 图 形 参数 

除了 像 上 面 那样 用 par( ) 函数 永久 修改 图 形 参 数 外 ,还 可 以 在 几乎 任何 
图 形 函 数 中 指定 图 形 参 数 作为 有 名 参数 ,这样 的 修改 是 临时 的 ,只 对 此 函数 起 
作用 . 例如 : 

plot(x,y,pch="+") 
就 是 用 图 形 参数 pch 指定 了 绘制 散 点 的 符号 为 “加 号 ”. 这 个 设 定 只 对 这 一 幅 
图 有 效 , 对 其 他 的 图 形 没有 影响 . 

7. 图 形 参 数 详解 

鉴于 绘制 有 特殊 需要 的 图 形 是 R 的 一 个 强项 ,而 使 用 图 形 参数 是 完成 此 
类 任务 的 重要 手段 ,因此 我 们 在 这 里 较 详细 地 介绍 R 的 各 种 图 形 参 数 . 这 些 
图 形 参数 可 以 大 体 上 分 为 以 下 几 大 类 : 

。 图 形 元 素 控制 ; 

。 坐标 轴 与 坐标 刻度 ; 

。 图 形 边 空 ; 

。 一 页 多 图 . 

( i ) 图 形 元 素 控制 

图 形 由 点 、 线 文本、 多边 形 等 元 素 构成 . 下 列 图 形 参数 用 来 控制 图 形 元 
素 的 绘制 细节 : 

。 pch=“+” 指定 用 于 绘制 散 点 图 的 符号 . 绘制 的 点 往往 略 高 于 或 略 低 

于 指定 的 坐标 位 置 ,只 有 pch=” ”没有 这 个 问题 . 
。 pch=4 如 果 pch 的 值 为 0~18 之 间 的 一 个 数字 ,将 使 用 特殊 的 绘 点 
符号 (图 2-14). 
下 例 可 以 显示 所 有 特殊 绘 点 符号 : 
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>plot(c(0,100) ,c(0,100) ,type="n", axes=F,xlab=’ ’,ylab=’ ') 
>legend(10 ,90 ,as. character(0:9) ,pch=0:9) 
>legend(50 ,90 ,as. character(10:18) ,pch=10:18) 
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图 2-14 特殊 绘 点 符号 


。 lty=2 指定 画 线 用 的 线 型 . 默认 值 lty = 1 是 实 线 , 从 2 开始 是 各 种 虚 
线 . 

。 lwd=2 指定 线 的 粗细 ,以 标准 线 粗细 为 单位 . 这 个 参数 影响 数据 曲 
线 的 线 宽 以 及 坐标 轴 的 线 宽 . 下 例 绘制 余 割 曲线 图 (图 2-15): 

>oldpar= par( lwd =2) 

> x=seq( -10,10,0.5) 

>ch=function(x) (exp(x) +exp(—x))/2 

> plot(x,ch(x) ,type="1") 

> par( oldpar) 

e col 指定 颜色 ,可 应 用 于 绘制 点 、 线 、 文 本 、 填 充 区 域 和 图 像 ， 颜色 值 
也 可 以 用 red、blue 这 样 的 颜色 名 指定 . 函数 colors( ) 的 结果 为 R 中 定 
义 的 颜色 向 量 . 

e font=2 指定 字体 . 一 般 情 况 下 ,font=1 表示 正体 ,font=2 表示 黑体 ， 
font=3 表示 斜体 ,font=4 表示 黑 斜 体 . 

e font. axis font. lab font. main 和 font. sub 分 别 用 来 指定 坐标 刻度 、 坐 标 
轴 标 签 .标题 .小 标题 所 用 的 字体 . 

。 adj=-0.1 指定 文本 相对 于 给 定 坐 标的 对 齐 方 式 . 取 0 表示 左 对 齐 ， 
取 1 表示 右 对 齐 , 取 0.5 表示 居中 . 此 参数 的 值 实际 代表 的 是 出 现在 
给 定 坐标 左边 的 文本 的 比例 ,所 以 adj= -0.1 的 效果 是 文本 出 现在 给 
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定 坐标 位 置 的 左边 ,并 空 出 相当 于 文本 10% 长 度 的 距离 . 
cex= 1.5 指定 字符 放大 倍数 (可 以 不 取 整 数 ). 


(站) 坐标 轴 与 坐标 刻度 

许多 高 级 图 形 带 有 坐标 轴 , 也 可 以 先 不 画 坐 标 轴 , 其 后 用 axis( ) 单 独 加 . 
函数 box( ) 用 来 画 坐 标 区 域 四 周 的 框 线 . 

坐标 轴 包 括 三 个 部 件 一 一 轴线 (用 lty 可 以 控制 线 型 ) 、 刻 度 线 和 刻度 标 
签 .它们 可 以 用 如 下 的 图 形 参数 来 控制 : 


lab=c(5,7,12) 第 一 个 数 为 x 轴 上 画 的 刻度 线 数 ,第 二 个 数 为 y 轴 
上 夯 的 刻度 线 数 ,这 两 个 数 是 建议 性 的 . 第 三 个 数 是 坐标 刻度 数值 的 
宽度 , 按 字符 数 计算 ,包括 小 数 点 . 此 宽度 取得 太 小 会 使 各 刻度 数值 
四 舍 五 人 成 相同 的 值 . 
las=1 坐标 刻度 标签 的 方向 . 0 表示 总 是 平行 于 坐标 轴 ,1 表示 总 是 
水 平 ,2 表示 总 是 垂直 于 坐标 轴 . 
mag=c(3,1,0) 坐标 轴 各 部 件 的 位 置 . 第 一 个 元 素 为 坐标 轴 位 置 到 
坐标 轴 标 签 的 距离 ,以 文本 行 高 为 单位 . 第 二 个 元 素 为 坐标 轴 位 置 到 
坐标 刻度 标签 的 距离 . 第 三 个 元 素 为 坐标 轴 位 置 到 实际 画 的 坐标 轴 
的 距离 ,通常 为 0. 
tck=0.01 坐标 轴 刻 度 线 长 度 ,单位 是 绘图 区 域 大 小 , 值 为 占 绘图 区 
域 的 比例 . tek 小 于 0.5 时 ,x 轴 和 y 轴 的 刻度 线 将 统一 到 相同 的 长 
度 . 取 1 时 即 画 格子 线 , 取 负 值 时 刻度 线 画 在 区 域 的 外 面 . 
xaxs=“s”,yaxs=“d” 控制 x 轴 和 >y 轴 的 画 轴 方法 . 
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取 值 设 为 “s”( 即 standard) 或 “e”( 即 extend) 时 ,数据 范围 控制 在 最 小 刻 
度 和 最 大 刻度 之 间 . 取 “e” 时 ,如 果 有 数据 点 十 分 靠近 边缘 , 轴 的 范围 会 略微 
扩大 . 这 种 画 轴 方 式 有 时 会 在 轴 的 一 边 留 下 太 大 的 空白 . 

取 值 为 “i”( 即 internal) 或 “r" (此 为 默认 值 ) ,将 使 刻度 线 都 落 在 数据 范 
围 内 部 ,而 “r” 方 式 所 留 的 边 空 较 小 . 取 值 设 为 “~d” 时 会 锁定 此 坐标 轴 , 后 续 的 
图 形 都 使 用 与 它 完 全 一 样 的 坐标 轴 , 这 在 要 生成 一 系列 可 比较 的 图 形 时 是 有 
用 的 . 要 解除 锁定 ,需要 把 这 个 图 形 参数 设 为 其 他 值 . 

〈 下 ) 图 形 边 空 

R 中 一 个 单独 的 图 由 绘图 区 域 和 包围 绘图 区 域 的 边 空 组 成 . 边 空 中 可 以 
包含 坐标 轴 标 签 、 坐 标 轴 刻度 标签 标题 .小 标题 等 ,绘图 区 域 一 般 被 坐标 轴 包 
围 , 见 图 2-16. 


mai[3] 





图 2-16 图 形 边 空 


边 空 的 大 小 由 参数 mai 或 mar 控制 . 它们 都 是 包含 4 个 元 素 的 向 量 ,分 
别 规定 下 方 \ 左 方 、 上 方 \ 右 方 的 边 空 大 小 ,其 中 mai 取 值 的 单位 是 英寸 ,而 
mar 的 取 值 单位 基文 本 行 高 度 . 例如 : 

>par( mai=c(2,2,1,0.2)) 

>par(mar=c(4,2,2,1)) 
这 两 个 图 形 参数 不 是 独立 的 , 设 定 一 个 会 影响 另 一 个 . R 中 默认 的 图 形 边 空 
常常 太 大 ,以 至 于 有 时 图 形 窗口 较 小 时 边 空 占 了 整个 图 形 的 很 大 一 部 分 . 通 
常 我 们 可 以 取消 右边 空 ,并 且 在 不 用 标题 时 可 以 大 大 缩小 上 边 空 .例如 ,下 例 
可 以 生成 十 分 紧凑 的 图 形 : 

>oldpar=par( mar=c(2,2,1,0.2)) 
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>plot(x,y) 

在 一 个 页 面 上 画 多 个 图 时 边 空 自动 减 半 , 但 往往 还 需要 进一步 减 小 边 空 
才能 使 多 个 图 有 意义 . 

(iv ) 一 页 多 图 

R 还 可 以 在 同一 页 面 开 若干 个 按 行 、 列 排列 的 窗 格 ,在 每 个 窗 格 中 可 以 作 
一 幅 图 . 每 个 图 有 自己 的 边 空 ,而 所 有 图 的 外 面 都 可 以 包 一 个 “外 边 空 ”, 见 图 、 
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2-17 一 页 多 图 


一 页 多 图 用 参数 mfrow 或 mfcol 规定 ,例如 : 
>par( mfrow=c(3,2)) 
表示 同一 页 有 3 行 2 列 , 共 6 个 图 ,而 且 次 序 为 按 行 填 放 . 类似 地 ， 
>par(mfcol=c(3,2) ) 
规定 相同 的 窗 格 结构 ,但 是 次 序 为 按 列 填 放 , 即 先 填 满 第 一 列 的 3 个 ,再 填 第 
二 列 . 要 取消 一 页 多 图 只 要 再 运行 : 
> par(mfrow=c(1,1)) 


即 可 . 
默认 时 无 外 边 空 .为 了 规定 外 边 空 大 小 ,可 以 在 par( ) 中 使 用 参数 omi 或 
oma. omi 以 英寸 为 单位 ,oma 以 文本 行 高 为 单位 . 两 个 参数 均 为 包含 4 个 元 素 
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的 向 量 , 分 别 给 出 下 、 左 、 上 、 右 方 的 边 空 大 小 .例如 : 

> par(oma=c(3,3,2,3) ) 

函数 mtext( ) 用 来 在 左边 空中 加 文本 标注 . 其 用 法 为 

mtext( text, side =3 ,line =0 ,outer=FALSE) 
其 中 text 为 要 加 的 文本 内 容 , side 表示 在 哪 一 边 写 (1 为 下 ,2 为 左 ,3 为 上 ,4 
为 右 ) ,line 表示 边 空 从 里 向 外 数 的 第 几 行 (最 里 面 的 一 行 是 第 0 行 ).. outer= 
FALSE 时 使 用 外 边 空 ,否则 会 使 用 当前 图 的 边 空 . 例如 : 

>par(mfrow=c(2,2),oma=c(0,0,3,0),mar=c(2,1,1,0.1)) 

>plot(x) ;plot(y) ;boxplot( list(x=x,y=y)) ;plot(x,y) 

> mtext("Simulation Data" ,outer=T,cex=1.5) 

在 多 图 环境 中 还 可 以 用 mfg 来 直接 跳 到 某 一 个 窗 格 , 比 如 : 

>par( mfg=c(2,2;,3,2)) 
表示 在 3 行 2 列 的 多 图 环境 中 直接 跳 到 第 二 行 第 二 列 位 置 . mfg 中 的 后 两 个 
数 表示 多 图 环境 的 行 、 列 数 , 前 两 个 数 表 示 要 跳 的 位 置 . 

可 以 不 使 用 多 图 环境 而 直接 在 页 面 中 的 任意 位 置 产生 一 个 窗 格 来 绘图 ， 
参数 为 fig, 例如 : 

> par(fig=c(4,9,1,4)/10) 
此 参数 为 一 个 向 量 , 分 别 给 出 窗 格 的 左 、 右 ,下 、 上 边缘 的 位 置 , 取 值 为 占 全 页 
面 的 比例 ,比如 上 面 的 例子 中 ,在 页 面 的 右 下 方 开 一 个 窗 格 作 图 . 

8. 图 形 设备 

R 中 作 的 图 支持 各 种 图 形 设备 ,其 中 常用 的 是 显示 器 和 PostScript 打印 
机 . 在 一 个 运行 期 间 可 以 有 多 个 图 形 设备 同时 存在 .在 R 中 ,用 


xll() 

打开 图 形 窗 口 绘图 . 再 次 调用 这 样 的 函数 将 打开 第 二 个 图 形 窗口 . 用 
dev. list( ) 

可 显示 已 打开 的 图 形 设备 列表 . 要 关闭 一 个 图 形 设备 ,用 
dev. off( ) 


这 可 以 使 得 图 形 得 以 完成 ,例如 ,对 于 PostScript 设备 ,关闭 设备 时 可 完成 打印 
或 存盘 .用 graphics. off( ) 函数 可 以 关闭 所 有 打开 的 图 形 设备 . 

MS Windows 下 的 R 可 以 把 显示 窗口 中 的 图 形 复制 到 剪贴 板 或 保存 为 各 种 
格式 的 图 形 文件 ,包括 WMF、PostScript .PDF .PNG .BMP 以 及 JPEG. 这样 可 以 用 
R 生成 所 需 的 图 形 ,然后 存 为 需要 的 格式 .如果 用 MS Word 排版 , 则 可 以 把 屏幕 
图 形 存 为 WMF 等 格式 . 生成 PostScript 文件 的 设备 可 以 用 如 下 函数 打开 : 

>PostScript (file = "result. ps" ,horizontal =FALSE ,width =5 ,height=3) 
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这 时 用 图 形 命 令 生成 一 个 页 面 的 图 形 , 然 后 用 dev. off( ) 关 闭 设备 , 则 可 
生成 文件 result. ps( ). PostSeript( ) 函数 中 的 horizontal 参数 指定 是 否 将 图 旋转 
90 度 ,使 得 x 轴 平行 于 纸 的 长 度 ，width 和 height 规定 图 的 宽 和 高 ,单位 是 英 
寸 (1 英寸 等 于 2.54 厘米 ). 

在 打开 了 多 个 图 形 设 备 后 ,可 以 用 dev. set( ) 函数 来 选择 当前 设备 . 
dev. next( ) 和 dev. prev( ) 分 别 返 回 下 一 个 和 上 一 个 图 形 设备 . 

9. 极 坐标 图 形 的 绘制 

R 绘 制 极 坐标 图 形 的 命令 是 polar plot (ri 9). 例如 绘制 += 


2eos( 2 0- 全] ) 的 图 形 ,其 中 0<b<27. 首先 加 载 library (plotrix) , 令 theta = 


seq(0,2*pi,by=0.0]1 *2* pi),r=2* cos(2* (theta-pi/8)),1 运 行 polar. 
plot(r,theta ,method =2 ) 得 到 图 2-18. 
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2-18 "=2eos(2( S| ) 的 图 形 
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2.10 解 方程 


在 求解 极 大 似 然 方程 时 ,有 时 很 难 直 接 得 到 其 显 式 解 , 需 要 用 数值 方法 . 
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因此 在 本 节 中 我 们 对 用 R 求解 方程 进行 介绍 . 
1. 求 一 元 多 项 式 的 根 
设 一 元 多 项 式 为 
f(x)=a0 +axt +ax +ax". 
用 RR 求解 上 式 的 根 的 程序 为 

>a=c(ao,al,. ,a,) ;polyroot(a) 

例如 , 求 函数 的 xz) = 3x ”+ x - 4 的 根 . 

令 a=ce(-4,1,0,3) ,并 运行 polyroot(a) 得 到 此 函数 的 3 个 根 分 别 为 1， 
-0.5+1.040833i,-0.5-1.040833i. 

2. 求 一 元 非 线性 方程 的 解 

假设 方程 为 (x) = 0. 如 果 要 求 它 的 解 ,但 又 不 知 其 解 的 范围 ,那么 可 先 
画 出 函数 f(x) 的 曲线 图 ,观察 自 变量 x 的 取 值 范围 ,再 利用 R 程序 uniroot( ) 
得 到 其 解 . 

例如 , 求 方程 

(1 -0)* -20(1 - 09)’ - 
的 解 . 

令 /(0) = 地 (1 -0)* -20(1-0)? -六 0+ +20(1 - 09), 作出/(9) 的 图 ， 
见 图 2-19. 从 图 2-19 中 可 看 出 , f(0) 有 3 个 根 ,它们 分 别 位 于 (0.2,0.3)， 
(0.4,0.6), (0.7,0.9) 之 间 . 直接 运行 uniroot (f,c(0.2,0.3)),uniroot(f, 
c(0.4,0.6)),uniroot(f,c(0.7,0.9)) 得 到 3 个 根 分 别 为 0.211 ,0. 5 ,0.789. 

或 者 先 加 载 包 library( rootSolve) ,然后 运行 uniroot. all(f,c(0,1)) 可 以 得 
到 f( 09) 在 区 间 (0,1) 内 的 以 上 3 个 根 . 

3. 求 非 线性 方程 组 的 解 

例如 , 设 非 线性 方程 组 为 


1 


20 +20(1 -0)=0, 9 ee [0,1] 


. +y =1, 
7” = 2x. 
求 上 述 非 线性 方程 组 的 解 . 运行 下 述 程序 : 

>model= function(x) {c(Fl=x[1] ?+x[2]?-1,F2=x[2]?-2*x[l])}# 定 
义 方 程 

>library (rootSolve )# 加 载 rootSolve 包 

>multiroot( model,c(1,1)) 


76 


一 一 第 2 章 R 介绍 和 一 一 一 一 一 一 一 一 一 


0.4 
2 
吕 0.0 
-0.2 
-0.4 
0.0 0.2 0.4 0.6 0.8 
6 
图 2-19 人 6) 的 曲线 图 
$ root 
[1] 0.4142136 0.9101797 
$ f. root 
Fl F2 

6.43565e-10 6.39019e-10 
$ iter 
人 时 


$ estim. precis 

[1] 6.43565e-10 

得 到 解 x = 0. 4142, y = 0. 9102. 

注 :选择 的 初始 值 必须 使 Jacobi 行列 式 不 为 零 . 
4. 微 商 的 计算 


例如 ,已 知 y=log(x+ Vl+x ), 求 y',y". 
首先 ,定义 函数 : 

>y=expression( log( x+sqrt( 1+x’2))) 
>deriv(y,"x" )# 求 y 关 于 x 的 一 阶 导 


expression ( | 
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.expr2 <-- 1 +X^2 
.expr4 <— x + sqrt(. expr2) 
.value <- log(. expr4) 
. grad <— array(0, c(length(. value), 1L), list(NULL, c("x"))) 
.grad[, "x"] <- (1 +0.5 * (2 * x * .expr2° -0.5))/.expr4 
attr(. value, " gradient" ) <—. grad 
. value 
1) 
其 中 .grad[, "x"] <-(1 +0.5 * (2 * x * .expr2° -0.5))/.expr 即 
为 了 ,再 运行 deriv3(y,"x" ) 得 到 
expression( | 
.expr2 <- 1 +x*2 
. expr4 <— x + sgrt(. expr2 ) 
.exp™6 < 一 2 * x 
. expr7 <— .expr2” -0.5 
. exprl0 <- 1 + 0.5 * (.expr6 * .expr7) 
. value <— log(. expr4 ) 
. grad <— array(0, c(length( .value), 1L), list(NULL, c("x"))) 
. hessian <— array(0, c(length(. value), 1L, 1L), list( NULL, 
c("x"), c("x"))) 
. grad[ , "x" ] <- .exprl0/. expr4 
.hessian[ , "x","x"] <- 0.5 * (2 * .expr7 + .expr6 * (-0.5* 
(.expr6 * .expr2^ -1.5) ) )/. expr4 - .exprl0 * .exprl0/. ex- 
pr4^ 2 
attr(. value, " gradient" ) <— . grad 
attr(. value, "hessian" ) <— . hessian 
. value 
}) 
其 中 hessian[，"x","x"]<- 0.5*(2*.expr7 + .expr6 * (-0.5* 
(. expr6 * .expr2* -1.5)))/.expr4 - .exprl0 * . exprl0/. expr4^ 2 即 表 示 所 求 
的 y". 
用 R 不 仅 可 以 计算 函数 的 极限 、 积 分 表达 式 , 还 可 以 解决 优化 问题 ,但 这 不 
是 本 书 的 目的 ,所 以 不 作 详 细 介 绍 . 有 兴趣 的 读者 可 以 参考 R 的 “帮助 ”文件 . 


78 





第 2 章 R 介绍 ， 





练 习 2 


1. 如 何 安装 R 软件 ? 如 何 下 载 和 安装 极 坐标 软件 包 plotrix? 
2. 如 何 调用 并 读 取 C: 中 的 data. txt 文件 ?如 何 读 取 Excel 数据 ? 
3.R 中 的 向 量 默 认 时 是 行 向 量 还 是 列 向 量 ? 在 矩阵 中 byrow=TRUE 是 什 
么 含义 ? 什么 叫 对 象 ? 
4. 在 R 的 列表 中 元 素 的 长 度 必须 一 样 吗 ? R 的 列表 有 维 数 吗 ? 数据 框 
有 维 数 吗 ? 
5. 如 何 产生 三 阶 单位 矩阵 ? 如 何 求 矩阵 的 逆 和 和 矩阵 的 转 置 ? 
6. 解释 函数 legend( ) 的 作用 ,各 参数 代表 什么 含义 ? 
7. 如 何 求 解 微分 方程 y' + 3y - e* =x, 且 y(0)=1. 
8. 假设 有 2008 年 xX 市 住房 销售 数据 如 下 : 
月 份 ” 总 套数 90m* 以 下 90~120m” 120~140m* 140m* 以 上 


08.1 3517 726 1117 1042 632 
08.2 1428 W272 463 432 261 
08.3 3659 940 1213 989 517 
08.4 2957 800 944 750 462 
08.5 4516 1194 1439 1261 667 
08.6 4382 1229 1418 1140 595 
08.7 4258 T1129 1392 1164 573 
08.8 2941 808 972 749 411 
08.9 2318 682 746 557 334 
08.10 3278 1025 1096 726 430 
08. 11 4253 1278 1385 986 604 
08.12 4027 1088 1355 1043 541 


画 出 各 类 住房 的 散 点 图 、 条 形 图 、Q-Q 图 、 箱 型 图 、 茎 叶 图 、 核 密度 估计 曲线 图 ， 
并 将 上 述 图 设置 不 同 颜色 ,再 将 各 类 住房 的 上 述 图 形 分 别 画 在 不 同 的 页 面 上 . 
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调用 R 函数 可 以 完成 基本 的 统计 分 析 . 下 面 介绍 如 何 用 R 进行 描述 统 
计 、 探 索性 数据 分 析 、 分 布 研究 和 常见 的 假设 检验 ,还 可 以 求 置信 区 间 ， 


3.1 单 变 量 数据 分 析 


对 存放 在 向 量 或 数据 框 中 的 变量 可 以 用 smmary( ) 函数 来 计算 几 个 描述 
性 统计 量 . 例如: 
>cl =read. table( "c:/simR/class. txt" ， 
+ col. names=c(“ Name" ,"Sex" ,"Age" ," Height" ," Weight" )) 
>summary( cl1) 


Name Sex Age Height Weight 

车 丰 #zecl F:9 Min. :12.00 Min. :142.0 Min. :40 
陈胜 : 1 M:10 1st Qu.:12.00 lst Qu. :147.0 -1st Qu. :43 
陈 凯 : 1 Median :13.00 Median :149.0 Median :48 
陈 美 玲 : 1 Mean :12.95 Mean :148.5 Mean :47 
胡 进 : 1 3rd Qu. :13.50 3rd Qu. :150.5 3rd Qu. :50 
胡 敏 : 1 Max. :14.00 Max. :155.0 Max. :58 
( Other) :13 


对 数值 型 变量 计算 了 平均 值 .最 大 值 .最 小 值 .中 位 数 .四 分 之 一 和 四 分 之 三 分 
位 数 , 对 因子 计算 了 频数 统计 . 

对 数值 型 变量 x 也 可 以 用 mean ,sd ,var,median ,min,max 等 函数 来 计算 其 
简单 统计 量 . 可 以 用 stem(x) 绘 制 x 的 茎 叶 图 ,用 hist(x) 画 直方 图 ,用 boxplot 
(x) 画 盒 形 图 ,用 qqnorm(x) 和 qqline(x) 画 正 态 Q-Q 图 . 

为 了 估计 数值 型 变量 的 分 布 密度 ,除了 用 hist( ) 画 直 方 图 外 ,还 可 以 用 
density( ) 函数 进行 非 参数 密度 估计 .例如 : 


>attach(cl ) 
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>plot( density( Height) , main =" Heightdensity" ) 
结果 见 图 3-1. 还 可 以 设法 把 核 密度 曲线 加 到 直方 图 上 ,例如 : 


Height density 


140 145 150 155 
N=19 Bandwidth=1.305 


图 3-1 核 密度 曲线 


>hl =hist( Height, prob =T, plot =T) $ density 
>h2 = density ( Height) 
>hist( Height, prob=T,ylim=range(hl,h2 $ y)) 
>lines( h2) 
果 见 图 3-2. 


es 


Histogram of Height 
0.15 
0.10 
证 
bl 
5 
A 0.05 
0.00 
| ha i i Rt PR i 
142 146 150 154 
Height 


图 3-2 身高 直方 图 与 核 密度 估计 曲线 
对 因子 (分 类 变量 )f 可 以 用 table(f) 统 计 其 频数 分 布 ,用 Blot(f) 画 其 频数 
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分 布 图 . 例如 : 
>table( Sex) 
Sex 
FM 
9 10 


3.2 ”假设 检验 
R 中 的 stats 程序 包 ( package) 提供 了 常见 的 假设 检验 功能 . stats 包 默认 时 


自动 调 人 . 
为 了 检验 正 态 性 ,只 要 调用 shapiro. test( ) 函数 就 可 以 做 Shapiro-Wilk 检 


验 » 
>shapiro. test( Height) 
Shapiro-Wilk normality test 
data: Height 
W = 0.9496, p-value = 0.3888 
可 见 身 高 数据 的 正 态 性 很 好 . 


函数 t test( ) 可 以 进行 单 总 体 的 1: 检验、 两 独立 总 体 的 1 检验 和 成 对 : 检 
验 . 例如 ,下 面 的 程序 检验 身高 均值 是 否 为 148. 5: 
>t. test( Height ,mu= 148.5) 
One Sample t-test 
data: Height 
t = 0.034, df = 18, p-value = 0.9732 
alternative hypothesis: true mean is not equal to 148. 5 
95 percent confidence interval : 
146. 9008 150.1518 
sample estimates: 
mean of x 
148.5263 
默认 时 进行 的 是 双 侧 检验 . 为 了 进行 单 侧 检 验 ,可 以 指定 alternative =“ grea- 
ter” 或 “less”. 例如 : 
>t. test( Height, mu = 148.5 ,alternative =" less" ) 
One Sample t-test 
data: Height 
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t = 0.034, df = 18, p-value = 0.5134 
alternative hypothesis: true mean is less than to 148.5 
95 percent confidence interval ， 
-Inf 149.868 
sample estimates : 
mean of x 
148.5263 
对 于 用 分 组 变量 表示 的 两 个 独立 组 ,可 以 用 +. test (分析 变 量 ~ 分 组 变 
量 ) 的 调用 形式 进行 独立 两 组 的 上 检验 . 例如 : 
>t. test( Height ~ Sex) 
Welch Two Sample t-test 
data: Height by Sex 
t = -2.1811, df = 14.832, p-value = 0.0457 
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval: 
-6.15437234 -0.06784988 
sample estimates: 
mean in group 下 mean in group M 
146. 8889 150. 0000 
注意 ,上 面 用 的 是 不 需要 假定 两 组 方差 相等 的 Welch 检验 . 如 果 假 定 两 
组 方差 相等 , 则 可 以 在 函数 调用 中 增加 参数 var. equal =TRUE. 如 果 两 个 独立 
组 放 在 两 个 变量 xl 和 x2 中 , 则 可 以 直接 用 .test(xl,x2) 进 行 比较 . 
用 wilcox. test( 分 析 变 量 ~ 分 组 变量 ) 或 wilcox. test(x1,x2) 可 以 进行 独立 
两 组 的 Wilcoxon 秩 和 检验 . 
对 于 配对 观测 的 变量 x 和 7y, 比 较 时 只 需 用 t. test(x,y,paired=True). 用 
wilcox. test(x,y,paired=True) 可 以 进行 Wilcoxon 秩 和 检验 . 


3.3 R 统计 模型 简介 


R 中 实现 了 几乎 所 有 常见 的 统计 模型 ,而 且 多 种 模型 可 以 用 一 种 统一 的 
观点 表示 和 处 理 . 本 节 只 介绍 用 R 对 模型 作 分 析 , 而 不 介绍 模型 的 原理 . 
1. 统计 模型 的 表示 
很 多 统计 模型 可 以 用 一 个 线性 模型 来 表示 : 
83 


4 统计 模拟 及 其 R 实现 和 一 一 一 


这 去 六 pm + ei， a N(0,0°), i=1,,n, 
写 出 矩阵 形式 为 
y=XB+e. 
其 中 7 为 因 变 量 , X 为 模型 矩阵 或 称 设计 和 矩阵 ,各 列 为 xzo,xi，…z 等 自 变 量 ， 
xo 中 的 所 有 元 素 为 1 ,确定 此 模型 的 截 距 项 . 
在 R 中 ,模型 是 一 种 对 象 ,其 表达 形式 称 为 一 个 公式 (formula). 下面 先 举 
几 个 例子 .假定 y,x,x0,xl,… 是 数值 型 变量 ,X 是 矩阵 ,A,B,C,，… 是 因子 . 
。y~x,y~1+x 两 个 式 子 都 表示 y 对 x 的 简单 一 元 线性 回归 . 第 一 个 
式 子 带 有 隐 含 的 截 距 项 ,而 第 二 个 式 子 把 截 距 项 显 式 地 写 出 来 了 . 
。 log(y) ~xl+x2 表示 log(y) 对 xl 和 x2 的 二 元 回归 , 带 有 隐 含 的 截 距 
项 . 
。 y~ploy(x,2),y~1+x+I(x*2) ”表示 y 对 x 的 一 元 二 次 多 项 式 回归 . 
第 一 种 形式 使 用 正 交 多 项 式 ,第 二 种 形式 直接 使 用 x 的 各 寡 次 . 
。 y~A 单 因素 方差 分 析 ,指标 为 y, 分 组 因素 为 A. 
。y~A+tx 单 因素 的 协 方差 分 析 , 指 标 为 y, 分 组 因素 为 A, 协 变量 为 x. 
ey~A*B,y~A+B+A:B,y~A% in %B,y~A/B 非 可 加 两 因素 方差 
分 析 ,指标 为 y, 分 组 因素 为 A,B. 前 两 个 公式 表示 相同 的 交叉 分 类 设 
计 , 后 两 个 公式 表示 相同 的 退 套 分 类 设计 . 
y~(A+B+C)2,y~A*B*C-A:;B:C 表示 三 因素 试验 ,只 考虑 两 两 
交互 作用 而 不 考虑 三 因素 的 交互 作用 . 两 个 公式 是 等 价 的 . 
y~A*x,y~A/x,y~A/(x+1)-1 都 表示 对 因子 A 的 每 一 水 平 拟 合 
y 对 x 的 线性 回归 ,但 三 个 公式 的 编码 方式 不 同 . 最 后 一 种 形式 对 A 
的 每 一 水 平 都 分 别 估计 截 距 和 斜率 项 . 
。 y~A*B+tError(C) 表示 有 两 个 处 理 因素 A 和 B, 误 差分 层 由 因素 C 
确定 的 设计 . 
在 R 中 ,~ 运算 符 用 来 定义 模型 公式 .一 般 的 线性 模型 公式 为 
因 变 量 ~ 第 一 项 [+] 第 二 项 [+] 第 三 项 [ 土 ] … 
其 中 因 变 量 可 以 是 向 量 或 矩阵 ,或 者 结果 为 向 量 或 矩阵 的 表达 式 . [+] 是 加 
号 + 或 者 减 号 - ,表示 在 模型 中 加 入 一 项 或 去 掉 一 项 . 第 一 项 前 面 若 是 加 号 , 则 
可 以 省 略 . 
公式 中 的 各 项 可 以 取 为 : 
。 一 个 值 为 向 量 或 矩阵 的 表达 式 ,或 1. 
人 因 村 。 
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。 一 个 “公式 表达 式 ”, 由 因子 .向量 和 矩阵 通过 “公式 运算 符 " 连 接 而 
成 . 

每 一 项 都 定义 了 要 加 入 模型 矩阵 或 从 模型 矩阵 中 剔除 的 若干 列 . 工 表示 
一 个 截 距 项 列 ,除非 显 式 地 删除 ,否则 总 是 隐 含 地 包括 在 模型 公式 中 下面 列 
出 了 各 运算 符 的 简要 说 明 . 

。y~M y 作 为 因 变量 ,由 M 解释 . 
MI1+M2 加 入 M1 和 M2. 
M1-M2 加 入 M1 但 去 掉 M2 指定 的 项 . 
。 M1:M2 为 Ml 和 M2 的 张 量 积 .如果 两 项 都 为 因子 , 则 为 因子 的 交互 

作用 . 

。 Ml % in % M2 与 M1:M2 类似 但 模型 矩阵 编码 方式 不 同 . 
M1 * M2 等 于 Ml+M2+MI1:M2. 
Mn M 中 所 有 各 项 以 及 所 有 到 n 阶 为 止 的 交互 作用 . 
I(M) 将 M 隔离 ,使 得 M 中 的 运算 符 按照 原来 的 算术 运算 符 解 释 而 
不 是 按 公式 元 素 符 解释 . 表达 式 M 的 结果 作为 公式 的 一 项 . 

注意 ,在 函数 调用 的 括号 内 的 表达 式 按 普通 四 则 运算 解释 . 函数 I() 可 
以 把 一 个 计算 公式 封装 起 来 作为 模型 的 一 项 使 用 . R 的 模型 表示 只 给 出 了 因 
变量 和 自 变 量 以 及 自 变量 间 的 关系 ,这 样 只 确定 了 线性 模型 的 模型 矩阵 ,而 模 
型 参数 向 量 是 隐 含 的 ,并 没有 在 模型 公式 中 体现 出 来 . 这 种 做 法 使 用 于 线性 
模型 ,但 不 具有 普遍 性 ,例如 非 线性 模型 就 不 能 这 样 表示 . 

2. 线性 回归 模型 


拟 合 普通 的 线性 模型 的 函数 为 Im( ) ,其 简单 的 用 法 为 

>fitted. model = lm ( formula, data = data. frame ) 
其 中 ,data. frame 为 各 变量 所 在 的 数据 框 ,formula 为 模型 公式 ,fitted. model 是 
线性 模型 拟 合 结果 对 象 ( 其 class 属性 为 Im). 例如: 


> attach(cl ) 


> modell =lm( Weight ~ Height+Age,data=cl.frame) 

> modell 
可 以 拟 合 一 个 Weight 对 Height 和 Age 的 二 元 回归 ( 带 有 隐 含 的 截 距 项 ) ,数据 
来 自 数据 框 c1. 拟 合 的 结果 存 人 到 对 象 modell 中 . 注意 ,不 论 数 据 框 cl 是 否 
已 用 attach( ) 连接 到 当前 运行 环境 ,都 可 被 Im( ) 使 用 . Im( ) 的 基本 显示 十 分 
简练 : 

Call : 

lm (formula = Weight ~ Height + Age, data = cl.frame) 


85 





和 统计 模拟 及 其 RE 实现 > 





Coefficients: 
( Intercept) Height Age 
—141.224 3.597 1.278 
3. 提取 信息 的 通用 函数 
lm( ) 函数 的 返回 值 称 为 模型 拟 合 结果 对 象 ,本 质 上 是 一 个 具有 类 属性 值 
lm 的 列表 ,有 model、coefficients ,residuals 等 成 员 . 为 了 获得 更 多 的 拟 合 信息 ， 
可 用 对 lm 类 对 象 有 特殊 操作 的 通用 函数 . 这 些 函 数 有 :addl ( )，coeff( ) ， 
effects( ) ,kappa( ), predict( ), residuals( ) alias( ) deviance( ) ,family( ) ， 
labels( ) print( ) summary( ) ,anova( ) ,dropl( ) ,formula( ) ,plot( ) ,proj( ) . 
例如 : > predict( modell ) 
> family( modell ) 
下 面 列 出 了 Im 类 ( 拟 合 模型 类 ) 常 用 的 通用 函数 的 简单 说 明 . 
。 anova( 对象 1, 对象 2) ”把 一 个 子 模型 与 原 模型 比较 ,生成 方差 分 析 
表 . 
coefficients( 对 象 ) ”返回 回归 系数 (和 矩阵 ) ,可 简写 为 coef( 对象). 
deviance( 对象) 返回 残 差 平方 和 ,车 有 权重 , 则 加 权 . 
formula( 对 象 ) 返回 模型 公式 . 
plot( 对 象 ) ”绘制 模型 的 几 种 图 ,如 残 差 对 预测 值 图 . 
predict( 对 象 ,newdata = 数据 框 ) ,predict. gam( 对象 ,newdata= 数 据 框 ) 
有 了 模型 拟 合 结果 以 后 对 新 数据 进行 预报 . 指定 的 新 数据 必须 
与 建 模 时 用 的 数据 具有 相同 的 变量 结构 . 函数 结果 为 对 数据 框 中 每 
一 观测 的 因 变 量 的 预报 结果 (为 向 量 或 矩阵 ). 
predict. gam( ) 与 predct( ) 相同 但 适应 性 更 广 , 可 应 用 于 lm、 glm 
和 gam 的 拟 合 结果 . 比如 , 当 多 项 式 基 函 数 用 了 正 交 多 项 式 时 ,加 入 新 
数据 会 导致 正 交 多 项 式 基 函 数 改 变 ,用 predict. gam( ) 可 以 避免 由 此 
引起 的 偏差 . 
print( 对 象 ) ”简单 显示 模型 拟 合 结果 . 一 般 不 用 print( ) ,而 是 直接 
键 人 对 象 名 来 显示 . 
residuals( 对 象 ) ”返回 模型 残 差 (和 矩阵) ,车 有 权重 , 则 适当 加 权 . 可 
简写 为 resid( ). 
summary( 对 象 ) ”可 显示 较 详细 的 模型 拟 合 结果 . 
4. 方差 分 析 
方差 分 析 经 常用 于 研究 取 离 散 值 的 因素 对 一 个 数值 型 指标 的 影响 . R 中 
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进行 方差 分 析 的 函数 是 aov( ) ,格式 为 aov( 公 式 ,data= 数 据 框 ) ,用 法 与 Im( ) 
类 似 , 提取 信息 的 各 通用 函数 仍 有 效 . 

假设 有 不 同 品牌 的 木板 磨损 比较 的 数据 保存 在 “c:/simR/veneer. tex” 
中 .如 : 


>c2=read. table("c:/simR/veneer. txt" ,col. names=c("Brand" ," Wear" ) ) ;c2 


Brand Wear Brand Wear 
1 ACME 多 全 11 AJAX 1:9 
2 ACME 2.1 12 AJAX eh | 
3 ACME 2.4 13 Wm 
4 ACME Ph} 14 TUFF 人 和子 
5 CHAMP 2 15 TUFF 必 ; 直 
6 CHAMP 2.3 16 TUFF 2 
7 CHAMP 2.4 J TUFF 2 
8 CHAMP 2.6 18 TUFF 父 海 
9 AJAX 2 分 19 TUFF 人 
10 AJAX pA 20 TUFF 2.4 


首先 把 每 个 品牌 木板 的 磨损 情况 画 盒 形 图 并 且 放 在 同一 页 面 中 , 函数 如 
下 : 

> plot( Wear Brand , data = c2) 
结果 见 图 3-3. 这 种 图 可 以 直观 地 比较 一 个 变量 在 多 个 组 的 分 布 ,或 者 比较 几 
个 类 似 的 变量 . 从 图 中 可 以 看 出 ,AJAX 的 较 好 ,TUFFY 的 较 差 , 其 他 两 个 品牌 
差别 不 显著 . 


Wear 





ACME AJAX TUFF 
Brand 


图 3-3 各 品牌 磨损 的 箱 型 图 
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为 了 检验 品牌 这 个 因素 对 指标 磨损 量 有 无 显著 影响 ,调用 函数 aov( ) : 
> aov.c2=aov( Wear ~ Brand ,data=c2) 
> summary(aov. ec2 ) 
Df Sum Sg Mean Sq F value Pr( >F) 
Brand 3 0.51575 0.17192 6.6481 0.003998™ 
Residuals 16 0.41375 0.02586 


Signif. codes: 0 ”” 0.001’”’ 0.01’*’ 0.05'.’ 0.1' 1 


可 见 品牌 因素 是 有 显著 差异 的 . 
3.4 回归 分 析 实 例 


下 面 以 “c:/simR/class. txt” 的 数据 为 例 进行 分 析 . 我 们 希望 理解 体重 、 身 
高 年龄 和 性 别 等 变量 的 基本 情况 以 及 相互 关系 . 

1. 数据 输入 

假设 数据 放 在 文本 文件 “c:/simR/class. txt” 中 ,没有 列 标题 ,各 变量 上 下 
对 齐 . 先 把 数据 读 人 一 个 R 数据 框 对 象 中 : 

> cl=read.table("c:/simR/class. txt" ， 


+ col. names=c("Name" ,"Sex"," Age" ," Height" ," Weight" ), 


+ row. names=" Name" ) 
> cl 
Sex Age Height Weight 

李 丽 了 13 148 41 
王菲 下 13 150 45 
胡 敏 F 14 151 44 
李 艳 F 14 149 43 
马莉 F 12 143 40 
胡 进 M 14 L153 5 和 
率 捉 M 14 155. 58 
王建 军 M 12 149 2 
汪 平 M 12 148 48 

2. 探索 性 数据 分 析 


若 要 研究 各 变量 的 分 布 情 况 ,看 是 否 接近 正 态 , 有 无 明显 的 异常 值 ,有 没 
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有 明显 的 序列 关系 ,等 等 ;那么 我 们 可 定义 函数 来 画 出 常见 的 探索 性 数据 分 析 
图 形 ,给 出 一 种 直观 上 的 了 解 . 对 连续 型 变量 可 以 画 直 方 图 、 箱 型 图 、 分 布 密度 
估计 图 和 正 态 概率 图 ; 对 离散 型 变量 只 要 画 其 分 布 频数 条 形 图 即 可 ,分 布 频 
数 用 table( ) 函数 计算 .研究 序列 相关 性 ,可 以 作 时 间 序 列 图 和 自 相关 函数 图 . 
因为 这 些 图 经 常 重复 使 用 ,我 们 定义 函数 eda. shape( ) 和 eda. ts() ,将 上 述 分 
析 图 形 在 同一 页 面 画 出 ,用 以 探讨 各 数值 型 变量 的 分 布 情况 . 
eda. shape=function (x) | 
oldpar=par( mfcol=c(2,2), 
mar=o(22,0.2,00)., mgp=c(1.240.2.,0) ) 


hist(x, main="" ,xlab="" ,ylab="") 
plot( density(x) ;xlab="x" ,ylab="" ,main="") 
boxplot( x) 

qqnorm(x,main="" ,xlab="" ,ylab="") 
qqline( x) 

par( oldpar) 


invisible( ) 
| 
eda. ts=function (x)| 
oldpar=par( mfcol=c(2,1), 
mar=e(2;2;1,0:2),mgp=c(1.2,0.2,0)) 
plot. ts( x,xlab="x" ,main="") 
acf( x,xlab="x" ,main="") 
par( oldpar) 
invisible( ) 
| 
函数 中 最 后 的 invisible( ) 表示 在 命令 行 调用 此 函数 时 不 要 显示 任何 返回 
值 . 函数 density( ) 用 来 作 核 密度 曲线 估计 . 接着 把 数据 框 cl 连接 入 当前 的 搜 
索 路 径 中 ,以 便 直接 使 用 cl 中 的 变量 名 .利用 下 述 命令 画 出 图 3-4 和 图 3-5. 
>attach(cl ) 
>eda. shape( Height) 
>eda. ts( Heighi) 
从 图 3-4 可 以 看 出 ,身高 的 分 布 接近 正 态 分 布 且 无 明显 的 异常 点 . 
因为 数据 是 不 同 个 体 的 观测 ,不 可 能 有 序列 关系 ,所 以 没 必 要 画 出 身高 的 
时 间 序 列 图 . 为 了 研究 数值 型 变量 Weight、Height 和 Age 间 的 关系 ,我 们 用 
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图 3-4 身高 的 描述 性 统计 图 
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图 3-5 身高 的 折线 图 及 自 相关 图 


pairs( cbind( Height, Weight, Age) ) 画 出 其 散 点 图 阵 ( 图 3-6). 从 散 点 图 矩阵 可 
以 看 出 ,三 个 变量 之 间 都 可 能 有 线性 相关 关系 . 

为 了 研究 因子 Sex 对 其 他 变量 的 影响 ,可 以 画 Sex 在 不 同 水平 上 各 变量 
的 箱 型 图 ,程序 如 下 : 

> oldpar=par( mfcol=c(1,3)) 
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Age 
142144146148150152154 12.0 12.5 13.0 13.5 14.0 
图 3-6 身高 体重 和 年 龄 的 散 点 图 阵 
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图 3-7 男女 身高 ,体重 和 年 龄 的 箱 型 图 
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> boxplot( Weight ~ Sex,ylab="Weight") 

> boxplot( Height ~ Sex,ylab=" Height" ) 

> boxplot( Age ~ Sex,ylab=" Age") 

> par( oldpar) 
从 图 3-7 中 可 以 看 出 ,男女 的 体重 、 身 高 有 明显 的 差别 ,而 年 龄 则 差别 不 明显 . 
也 可 以 按 不 同性 别 对 某 一 变量 分 别 作 图 或 计算 . 这 里 只 要 使 用 像 Weight 
[Sex==“F”] ,Height[ Sex= =“M” ] 这 样 取 子 集 的 办 法 就 可 以 把 观测 值 进行 
分 组 . 

> Weight[ Sex= ="F"] 

[1] 41 45 44 43 40 43 40 41 46 

> Weight[ Sex= =" M" ] 

[1] 48 49 48 50 50 52 55 58 52 48 

更 进一步 ,还 可 以 用 函数 tapply( ) 直接 按 一 个 因子 对 观测 分 组 ,然后 用 函 
数 tapply( Weight ,Sex ,hist) 画 出 图 3-8. 从 图 3-8 中 可 看 出 男女 的 体重 略 有 差 
别 . 


Histogram of F Histogram of M 
4 6 
S 
3 
4 
> > 
8 8 
2 3 3 
应 加 
2 
1 
1 
0 0 
[= TT? FF 站 
40 42 44 46 48 52 56 
3-8 ”男女 体重 的 条 形 图 
3. 组 间 比 较 . 


我 们 来 分 析 男 女 的 身高 有 无 显著 的 差别 ,这 是 两 组 的 比较 问题 .上 面 


92 








第 3 章 常用 统计 分 析 从 


EDA 部 分 的 并 排 盒 形 图 已 经 提示 男女 身高 有 明显 差异 ,这 里 用 统计 假设 检验 
给 出 统计 结论 . 

男女 两 组 可 以 认为 是 独立 的 ,而 且 每 组 内 的 观测 也 可 以 认为 是 相互 独立 
的 .根据 EDA 的 结果 可 以 认为 两 组 都 来 自 正 态 总 体 . 这 样 , 我 们 可 以 使 用 两 样 
本 :检验 . 因为 方差 是 否 相 等 未 知 , 我 们 干脆 用 不 要 求 方差 相等 的 近似 两 样本 
上 检验 : 

> attach(cl) 

> t. test( Height ~ Sex,conf. level = 0.99) 

Welch Two Sample t-test 

data: Height by Sex 

t= -2.1811, df = 14.832, p-value = '0.0457 

alternative hypothesis: true differenice in means is not equal 

施 : 平 @ 
99 percent confidence interval: 
-7.321008 1.098785 
sample estimates: 
mean in group F mean in group M 
146. 8889 150. 0000 

结果 p 值 为 0.0457 ,对 检验 水 平 0.01 来 说 ,差异 是 不 显著 的 .所 以 从 这 组 样本 
看 ,男女 的 身高 没有 发 现 显著 差异 : 

类 似 可 以 进行 男女 体重 的 比较 ,p 值 为 6.971x10-s; 差 异 极 显著 . 

4. 回归 分 析 


下 面 研究 对 体重 的 预报 . 从 散 点 图 矩阵 看 ,体重 与 身高 有 明显 的 线性 相 
关 , 所 以 先 拟 合 一 个 体重 对 身高 的 一 元 线性 回归 模型 ; 

> lm. fitl =lm(Weight ~ Heightjdata=cl ) 

> lm. fitl 

Call: 

lIm(formula = Weight ~ Height, data = cl) 

Coefficients: 

(Intercept) Height 

—128.559 1. 182 

> summary (lm. fitl ) 

Call: 

lIm(formula = Weight ~ Height, data = cl) 
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Residuals: 

Min 1Q Median 3Q Max 
=53:-9289 :r=1:8779~ 055321 2.5761 4.4401 
Coefficients: 


Estimate Std’ Error t value Pr(>|t|) 

(Intercept) -128.5589 34.7066 -3.704 0.00176™ 

Height 1.1820 0.2336 5.060 9.67e-05™ 

Signif. codes: 0 '™*’0.001 ”0.01 '*’0.05 0.1 1 

Residual standard error: 3.343 on 17 degrees of freedom 

Multiple R-Squared: 0.6009, Adjusted R-squared: 0. 5775 

F—statistic: 25.6 on 1 and 17 DF, p-value: 9.675e-05 
拟 合 的 模型 方程 为 Weight = -128. 5589+1.182xHeight, 复 相关 系数 平方 为 
0. 6009 ,检验 模型 的 斜率 为 0 的 p 值 为 9.67x10” ,可见 模 型 是 显著 的 . 对 于 一 
元 回归 ,可 以 用 命令 abline( lm. fitl ) 在 因 变 量 对 自 变 量 的 散 点 图 上 和 春 加 回归 
直线 来 看 回归 效果 , 见 图 3-9. 





142 146 150 154 
Height 


3-9 体重 对 身高 的 回归 直线 拟 合 图 


一 般 地 ,plot( ) 函数 可 以 对 Im 拟 合 结果 作出 若干 幅 图 形 来 验证 拟 合 效 
果 .R 中 可 以 作 4 个 图 : 残 差 对 拟 合 值 图 , 残 差 的 正 态 概率 图 ,标准 化 残 差 绝对 
值 平 方 根 对 拟 合 值 图 ,Cook 距离 图 . 

> oldpar=par(mfrow=c(2,2) ,mar=c(2.5,2,1.5,0.2) ,mgp=c(1.2,0. 
2,0) ) 

> plot(lm. fitl ) 
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> par( oldpar) 
结果 见 图 3-10. 


Residuals vs Fitted Normal Q-Q 


Residuals 
[= 












45 50 sl 0 1 
Fitted values Theoretical Quantiles 
Scale-Location Residuals vs Leverage 
3 
© 马 
be 
8 
号 
8 
号 
和 
四 mn 
六 40 45 50 55 0.00 0.05 0.10 0.15 0.20 0.25 


Fitted values Leverage 


图 3-10 体重 对 身高 的 回归 诊断 图 


如 果 和 希望 每 个 图 都 用 全 窗口 来 看 , 则 不 要 设置 图 形 参数 . 在 4 个 图 中 , 残 
差 对 拟 合 值 图 可 以 反映 残 差 中 残留 的 结构 . 如 果 模 型 是 充分 的 , 残 差 应 该 是 随 
机 地 变化 且 没 有 任何 模式 . 残 差 的 正 态 概率 图 可 以 检验 线性 回归 分 析 的 重要 
假定 一 一 误差 项 服从 正 态 分 布 是 否 合理 ,可 以 看 出 残 差 的 分 布 重 尾 、 轻 尾 、 左 
偏 、 右 偏 等 情况 . 标准 化 残 差 绝 对 值 平方 根 对 拟 合 值 图 可 以 发 现 残 差 的 异常 
值 点 , 即 拟 合 最 差 的 点 . Cook 距离 衡量 每 一 观测 对 拟 合 结果 的 影响 大 小 , 数 
值 大 的 为 强 影响 点 ,图 中 自动 标 出 了 最 突出 的 点 . 

从 lm. fitl 的 回归 诊断 图 看 , 残 差 没 有 明显 的 模式 ,但 残 差分 布 有 轻微 轻 
尾 倾向 ,没有 明显 的 异常 点 . 

下 面 我 们 看 加 入 其 他 变量 能 否 进 一 步 改 善 模型 的 预报 能 力 . 用 add1() 
函数 可 以 判断 加 入 新 的 变量 是 否 可 以 改善 模型 ; 

>addl(lm.fitl ,~.+Age + Sex) 

Single term additions 


Model : 
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Weight ~ Height 
Df Sum ofSq RSS AIC 
<none> 189.955 47.745 
Age 1 53.474 136.481 43.463 
Sex 1 138.707 51.248 24.852 
addl 的 结果 显示 为 一 个 方差 分 析 表 . <none> 行 是 不 加 变量 的 情况 ,Age 


行 是 加 入 一 个 变量 Age 后 的 情况 ,Sex 行为 加 入 一 个 变量 Sex 的 情况 . DF 列 
为 此 变量 的 自由 度 ,Sum of Sq 为 该 变量 对 应 的 平方 和 ,RSS 为 加 入 该 变量 后 
的 残 差 平方 和 ,AIC 为 加 入 该 变量 后 的 AIC 统计 量 值 . AIC 较 小 的 模型 较 好 . 
所 以 ,如果 加 入 某 个 变量 后 AIC 减 小 ,就 可 以 加 入 此 变量 . 这 里 加 入 Age 和 加 
人 Sex 都 使 AIC 变 小 ,所 以 应 该 加 入 这 两 个 变量 . 


量 后 


如 果 一 开始 就 加 入 了 所 有 变量 , 则 可 以 用 dropl( ) 函数 考察 去 掉 一 个 变 
AIC 是 否 变 小 : 

> lm.fif=lm(Weight ~ Height+AgetSex, data=cl) 

> summary(lm.fit2) 

Call . 

lm(formula = Weight ~ Height + Age + Sex, data = cl1) 


Residuals : 
Min 1Q Median 3Q Max 
-2.9448 -0.9273 0.0552 1.0967 3.2369 
Coefficients: 
Estimate Std. Error t value Pr(> |t|) 
(Intercept) -83.8401 27. 0209 -3.103 0.00728” 
Height 0.9448 0.2444 3.866 0.00152 
Age -0.9608 0. 9337. -1.029 0.31973 
SexM 5.6118 1.0650 5.270 9.44e-05"™ 
Signif. codes: 0 '*’0.001 '*™0.01'*’0.05'.0.1’' 1 
Residual standard error: 1.786 on 15 degrees of freedom 
Multiple R-Squared: 0. 8994 ， Adjusted R-squared: 0.8793 
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F-statistic: 44.72 on 3 and 15 DF, p-value: 1.021e-07 
> dropl( 1m. fit2) 
Single term deletions 


Model: 
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Weight ~ Height + Age + Sex 
Df Sum of Sq RSS AIC 


<none> 47.868 25.556 
Height 1 47.683 95.551 36.689 
Age 1 3.380 51.248 24. 852 
Sex 1 88.613 136. 481 43.463 


从 summary( ) 的 结果 看 ,Age 不 显著 . 用 drop1( ) 可 以 发 现 ,去 掉 Age 会 
使 AIC 从 25.556 变 小 为 24.852 ,所 以 应 该 去 掉 Age. 对 去 掉 Age 后 的 模型 再 
用 drop1( ) ,发 现 Sex 不 应 该 去 掉 . 在 修改 模型 或 数据 改变 后 重新 拟 合 时 还 可 
以 使 用 update( ) 函数 ,比如 要 从 lm. fit2 中 去 掉 Age ,就 可 以 用 

> lm.fit3=update(lm.fi2, ~. -Age ) 

得 到 最 后 的 模型 Im. fit3. 

在 自 变量 个 数 较 多 时 ,R 提供 了 step( ) 函数 ,用 来 进行 逐步 回归 . 它 从 一 
个 初始 模型 开始 ,自动 判断 增加 或 去 掉 变量 ,最 后 得 到 较 好 的 模型 : 

> lm.fi0=lm(Weight 1,data=cl) 

> lm. step=step(lm. fit0, ~.+Height+Aget+Sex) 

Start: AIC= 63.20 


Weight ~ 1 

| Df Sum of Sq RSS AIC 
+ Sex 1 337.78 138.22 41.70 
+ Height 1 286.05 189.95 47.74 
+ Age 1 61.75 414.25 62.56 
<none> - 476.00 63.20 
Step: AIC= 41.7 
Weight ~ Sex 

Df Sum of Sq RSS AIC 

+ Height 1 86.97 S125 24.85 
+ Age 1 42.67 95.55 36.69 
<none> 138.22 41.70 
— Sex 1 337.78 476. 00 63.20 


Step: AIC =24. 85 
Weight ~ Sex + Height 

Df Sum of Sq RSS AIC 
<none> 51.248 24. 852 
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+ Age 1 3.380 47.868 25.556 
- Height 1 86. 975 138. 222 41.704 
- Sex 1 138.707 189. 955 47.745 


得 到 适当 的 模型 后 ,就 可 以 用 模型 进行 拟 合 或 预报 . 只 需 对 模型 拟 合 结 
果 用 predict(lm.fit3 ) 函数 , 即 可 以 得 到 体重 的 预报 值 : 
李 丽 王菲 胡 敏 ” 李 艳 ”马莉 刘 玲 ， 朱 彤 陈 美玲 陈 匠 ” 刘 劲 
43.38 44.86 45.6 44.11 39.68 41.9 38.94 39.68 44.86 51.00 
王峰 李 明 陈 凯 张强 “ 张 勇 ， 胡 进 车 丰 王建 军 江平 
51.74 48.04 49.52 50.26 51.74 53.22 54.7 50.26 49.52 
我 们 还 可 以 用 命令 plot( Weight) 和 points( lm. fit3 ,col=“blue”,pch=8) 做 
出 体重 原始 数据 与 预报 值 的 对 比 图 (图 3-11). 





3-11 体重 原始 数据 与 其 预报 值 的 对 比 图 


如 果 想 对 新 数据 做 预报 ,只 需 在 predict( ) 函数 调用 时 加 入 新 数据 的 数据 
框 作为 参数 : 

> new. data = data. frame ( Height=c(150,151.2,148,149.7),Sex= 
eh MM ME TR” “7 

> predict(lm. fit3 ,new. data) 


1 3 4 
51.00000 45.74517 49. 52028 44. 63538 
3.5 随机 数 的 应 用 


产生 随机 数 是 做 统计 模拟 的 基础 ,而 如 何 产生 随 机 数 的 方法 在 一 般 的 计 
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算 机 书籍 中 都 有 所 介绍 ,我 们 在 此 不 再 熬 述 . 这 里 我 们 只 介绍 随机 数 在 计算 积 
分 上 的 应 用 . 本 书 中 的 随机 数 若 未 特别 说 明 都 是 指 (0,1) 随机 数 . 

令 g(X) 是 一 个 函数 ,假设 我 们 要 计算 .9 : 

0 = g(x)ax, 
注意 到 如 果 U0 服从 (0,1) 上 的 均匀 分 布 ,那么 就 有 9 = ELg(U)]. 车 UU， 
U,,…,U, 是 (0,1) 上 的 均匀 随机 变量 , 则 随机 变量 g( U1),g(U;),…,g(U;) 
是 均值 为 6 的 独立 同 分 布 的 随机 变量 . 因此 由 强大 数 定律 以 概率 1 有 
SB[5(UD] =0 “SPS. 


从 而 通过 产生 大 量 随机 数 wu 且 取 g(w;) 的 平均 值 作为 近似 值 ,我 们 就 能 够 近 
似 得 到 6, 此 近似 积分 方法 称 为 Monte Carlo 方法 . 
我 们 若 要 计算 


9 = | g(r) ds, 


可 利用 变换 y = 生 二 4,dy = 二 尘 = 得 到 
-a b=a 








0= [ela+ (ba -0)dy = {hy) dy, 


其 中 h(y)=g(a+ (6b -a)y)(b -a). 因此 我 们 连续 地 产生 随机 数 并 将 在 这 
些 随机 数 上 的 取 值 进行 平均 ,就 能 近似 得 到 6. 
计算 上 述 积分 的 R 程序 : 
fl =function(n,a,b,g) | 
x=runif(n) 
sum((b-a) * g(a+(b-a) * x))/n 
} 


【 例 3.1】 估计 积分 「 es, 


我 们 先 定义 函数 = exp(x + x )，, 其 R 代码 如 下 : 
g=function(x)exp(x+x’2) 

在 R 中 再 调用 函数 人 ， 
>{1 (10000,-2,2,g) 

得 到 积分 值 为 92. 196. 或 者 直接 利用 R 的 内 内 积分 函数 : 
>integrate( g, -2 ,2) 

也 可 得 到 积分 值 为 93.16275( 绝 对 误差 小 于 0. 00062). 
类 似 地 ,车 我 们 要 计算 
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0= | g(x) dx, 


dx 
(x+1)’ 


9= | 57)dy， 


我 们 通过 变换 y = 一 =- ?dz 得 到 


dy = 
IY 


a 
其 中 h(y) Ts 
用 随机 数 估 计 积 分 在 多 元 积分 中 的 用 途 显得 更 加 突出 .假设 g 是 一 个 有 
n 个 自 变 量 的 函数 , 若 我 们 要 计算 
0 -| [fel ,32 
首先 我 们 注意 到 用 Monte Catl 方法 估计 9 的 关键 是 
0=ELg(U,,U,,.…,U,)], 
其 中 Vi ,UV,,…,U, 是 相互 独立 的 (0,1) 上 的 均匀 分 布 随机 变量 . 
因此 我 们 产生 个 独立 的 集合 ,每 个 集合 由 n 个 独立 的 (0,1) 上 的 均匀 
分 布 随 机 变量 构成 : 
DU, 
UD, ,U? 


Ur , Ui, -te 
因为 g(UVi,UV;,…,U,),i=1,2,…,k 是 具有 均值 6 的 独立 同 分 布 的 随机 变量 ， 


g(Ui,U,,,U,) 
k 

【 例 3.2】 估计 二 重 积分 : | odxdy, 其 民 程 序 如 下 ， 

>X=runif(10000) 

>Y =runif(10000) 

>f=function(x,y)exp( (x+y)’) 

>sum(f(X,Y))/10000 
运行 上 述 程序 得 到 积分 值 为 4.907506. 

【 例 3.3】 (7 的 估计 ) 假 设 随机 变量 (X,Y) 是 服从 面积 为 4、 中 心 在 原 
点 的 正方 形 上 的 均匀 分 布 , 即 它 是 图 3-12 中 的 指定 区 域 的 随机 点 . 现在 我 们 
考虑 随机 点 落 在 半径 为 1 包含 在 正方 形 中 的 圆 盘 的 概率 . 由 于 (X,Y) 是 正方 
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形 上 的 均匀 分 布 ,就 有 
到 2 2 站 圆 盘 的 面积 相 
P|(X,Y) 属于 圆 盘 | = PIX + 六 < 1| = 证 方形 的 面 各 ”4 
从 而 ,车 我 们 在 正方 形 中 产生 大 量 的 随机 数 , 则 落 在 圆 中 的 随机 数 比率 近似 为 
玫 . 如 果 久 和 了 是 独立 的 且 都 服从 ( - 1,1) 上 的 均匀 分 布 ,其 联合 密度 将 是 


7xi7)=z)K7)= 了 :村 = 二， Sey<l. 





图 3-12 随机 数 的 投 点 


因为 天, 了) 的 联合 密度 在 正方 形 中 为 常数 ,由 定义 知 , (7Y) 在 正方 形 
中 服从 均匀 分 布 . 如 果品 服 从 (0,1) 上 的 均匀 分 布 ,那么 20 服 从 (0,2) 上 的 
均匀 分 布 ,等 等 ,25 -1 服从 (-1,1) 上 的 均匀 分 布 . 因此 如 果 我 们 产生 随机 
数 由 和 玩 ， 令 天 二 可 态 二 了 和 了 = 2 二 他 并 定义 
二 +Y<1l, 
0, 否则 . 


E[1] = PIX +Y <1| = 本 


从 而 我 们 能 用 大 量 的 随机 数 对 u, ,wu, 来 估计 二 也 就 是 用 满足 (2u, - 1)? + 
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(2u, - 1)” < 1 的 点 与 正方 形 中 点 的 比值 来 估计 他. 其 R 程序 如 下 : 


f=function(n) | 
k=0;ul =runif(n) ;u2=runif(n) 
X=2*ul-l;Y=2 *u2-1l 
for(iin 1:n)| 
if(X[i]“2+Y[i]“2<=1) 
k=k+1l 
} 
4*k/n 
| 


另外 一 种 估计 的 方法 是 计算 积分 | Vi 一 节 dx = 亿 ,这 种 估计 积分 的 
方法 在 上 面 已 经 介绍 了 , 称 为 平均 值 法 。 


练 习 3 


1. 设 X 服 从 正 态 分 布 N(1,2*), 用 R 计 算 PIX < 1.5} 和 Pl|X- 
1.5| 5 1}: 

2. 设 服从 二 项 分 布 B(100,0.6), 用 RR 计算 PIX<6| 和 Pl4<X< 
20| . 

3. 设 服从 指数 分 布 E(1.5), 计算 其 0.75 分 位 数 和 中 位 数 . 

4. 设 XX 服从 泊 松 分 布 P(4) ,计算 PI5 < X< 101. 

5. 设 某 工厂 在 正常 情况 下 生产 的 电灯 泡 的 寿命 X( 小 时 ) 服 从 正 态 分 布 . 
从 该 工厂 生产 的 一 批 灯 泡 中 随机 抽取 10 个 灯泡 , 测 得 其 寿命 为 

1450 ,1480 ,1640 ,1610. 1500 ,1600 ,1420 ,1530 ,1700. 1550. 

在 检验 水 平 a = 0. 01 下 , 试 检 验 这 批 灯泡 的 寿命 是 否 显著 超过 1600 小 时 ,并 
给 出 其 置信 度 为 99% 的 置信 区 间 . 

6. 调查 某 地 每 亩 30 万 苗 和 50 万 苗 的 称 田 ,分别 得 到 亩 产量 数据 如 下 : 
30 万 苗 800 840 870 920 850 835 840 860 865 810 
50 万 苗 900 880 890 890 840 885 895 880 875 875 885 895 
在 检验 水 平 a = 0.01 下 , 试 检验 两 种 密度 的 亩 产量 是 否 有 显著 的 差异 . 

7. 某 品 种 水 稻 糙 米 含 锅 量 y(mg/kg) 与 地 上 部 生物 量 x, (10g) 及 土壤 含 
锅 量 x,(100mg/kg) 的 8 组 观测 值 如 下 : 
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xj 1.37 11.34 9.67 0.76 17.67 15.91 15.74 5.41 
”» 0 I 306 :02 ,00 .DB L625 
y 4.93 1.86 2.33 5.78 0.06 0.43 0.87 3.86 
试 建立 二 元 线性 回归 方程 ,并 进行 检验 和 预报 . 
8. 用 模拟 的 方法 近似 计算 下 列 积分 ,并 和 已 知 的 精确 答案 进行 比较 . 


GD [0 -sds; 
(2) 人 #01 + we) dxi 
(3) | expl-# la; 


(4) | [2 aray, 
1, 荐 yY < % 
0 ,和 否则 
9. 用 随机 模拟 的 方法 计算 Cov(V,e ) , 其 中 上 是 (0,1) 上 的 均匀 随机 变 
量 ,并 和 你 的 精确 答案 进行 比较 . 
10. 对 (0,1) 上 的 均匀 随机 变量 局 ,U;,… ,定义 


N= min{n: 3 0, > 和 
i=1 


[提示 : 令 L(x) -| 


即 , N 等 于 使 其 和 超过 1 的 随机 数 的 个 数 . 
通过 产生 10000 个 N 的 值 来 估计 ELN], 并 猜测 ELN] 的 理论 值 是 多 少 . 
11. 令 以 宇 = 1 是 随机 数 序列 .定义 


N=min{n: 10. > e| ， 
Es] 


其 中 Ilv:=1. 


(1) 模 拟 计算 ELN]. 
(2) 通 过 模拟 计算 PIN =i| ,i=0,1,2,3,4,5,6. 
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第 基 章 和 
模拟 随机 变量 
如 果 已 知 某 个 概率 分 布 , 我 们 如 何 产生 出 具有 这 个 分 布 的 随机 变量 的 值 


呢 ? 本 章 将 介绍 一 些 产生 随机 变量 值 的 方法 . 同时 ,这些 内 容 也 是 在 进行 统计 
模拟 时 如 何 进行 随机 抽样 的 基础 . 


4.1 逆 变 换 方法 


1. 离散 随机 变量 情形 
假设 需要 生成 具有 如 下 概率 函数 的 离散 随机 变量 工 的 值 


PIX=%| = 万 ， j=0,1,.…, Bp=1. 
为 此 , 先 产 生 一 个 随机 数 U, 并 令 
x0o, 若 U < Po， 


%1, 若 po。 大 U < po +Pi， 


全 


广 1 
和 车 Pp <Ux< DP 


则 互 即 为 具有 此 概率 函数 的 随机 变量 的 值 . 其 原理 是 
若 0<a<pb<l,plaesr< 外 =-a, 则 有 


PIX=%| -| 5 <U< rl = pi 
所 以 X 就 是 所 求 的 服从 该 分 布 的 随机 变量 . 
注 : 若 x,,i 宇 0 是 有 序 的 且 x。< x， < x, < …, 又 令 玉 表示 的 分 布 函 数 ， 
就 有 F(z4) = 殉 p, 以 及 
着 F600) <U<FGG)， 则 X=% 


换言之 ,在 产生 随机 变量 U 后 ,我 们 根据 UV 的 取 值 区 间 [ F(x, ) ,F(x%)) 确定 
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了 的 值 ( 或 者 等 价 地 通过 找 F(U) 的 逆 ). 因 此, 上述 方法 称 为 生成 了 的 离散 递 
变换 方法 . 
按 上 述 方法 产生 一 个 随机 变量 所 花 的 时 间 与 要 找 的 区 间 数 成 比例 . 正 因 
如 此 ,有 时 需要 按 p; 的 降序 来 考虑 蕊 的 可 能 值 x 
【 例 4.1】 模拟 具有 如 下 概率 分 布 的 随机 变量 : 
wi = "0:10 b=00 六 =0040 0 p; 一 入 避 二 且 
其 算法 如 下 : 
产生 一 个 随机 数 U0， 
车 U < 0.10, 则 令 X =1 并 停止 ; 
车 U < 0.15, 则 令 X =2 并 停止 ; 
车 U < 0.55, 则 令 X =3 并 停止 ; 
其 他 , 令 =4. 
若 要 产生 个 这 样 的 随机 变量 ,其 R 程序 为 
>X=rep(0,n) # 或 X=numeric(n) 
>for(iin 1:n)| 
u=runif(1) 
i (u<0:1) X[i]=1 
else if (u<0.15) X[i] =2 
else if (u<0.55) X[i]=3 
else X[i] =4 
| 
然而 一 个 更 有 效 的 算法 为 
产生 一 个 随机 数 V， 
车 U < 0.45, 则 令 X=4 并 停止 ; 
车 U < 0.85, 则 令 和 =3 并 停止 ; 
若 U < 0.95, 则 令 和 =1 并 停止 ; 
其 他 , 令 X =2. 
当然 也 可 以 用 R 的 内 置 函数 sample( ) 来 产生 此 随机 变量 : 
yl 
>p=c(0.10,0.05,0.40,0.45) 
>sample(X,5,p=p,replace =TRUE )# 产 生 5 个 可 以 重复 的 随机 变量 X， 
replace =TRUE 表示 抽样 可 重复 ,默认 值 是 FALSE ,表示 不 重复 抽样 . 


车 要 产生 具有 离散 均匀 分 布 的 随机 变量 X 的 值 , 即 PIX = 放 = 一 ,j=1， 
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2,…,n ,运用 算法 





XX 二。 车 人 六 前 守 


就 可 得 到 的 值 . 然而 , 当 j -1 nV <j 时 ,X=j, 也 就 是 半 =Int(nU) + 1， 
其 中 Int(x) 有 时 写 为 [x], 即 不 大 于 <% 的 整数 部 分 . 其 R 程序 为 
>U=runif(1);X=floor(n* U)+l 
或 者 用 函数 sample( ) 来 产生 
>X=sample(1:n,1) 
【 例 4.2】 (随机 排列 /置换 ) 假 设 我 们 想 要 产生 1,2,… ,n 的 一 个 排列 ， 
则 有 n! 个 等 可 能 的 顺序 .我 们 给 出 产生 该 随机 排列 的 两 种 方法 . 
方法 1 首先 随机 地 选择 数字 1,2,…,n 中 的 一 个 数 并 将 此 数 放 在 第 
个 位 置 ,接着 从 剩 下 的 n - 1 个 数 中 随机 地 选择 一 个 并 将 之 放 在 第 n - 1 个 位 
置 , 再 接着 从 剩 下 的 n -2 个 数 中 随机 地 选择 一 个 并 将 之 放 在 第 n -2 个 位 置 ， 
等 等 . 
方法 甘 以 任何 一 个 初始 顺序 P,P,,… ,P, 开始 ,从 位 置 1,2,… ,n 中 随 
机 地 挑选 一 个 然后 与 位 置 n 中 的 数 互 换 . 随后 ,我 们 随机 地 选择 位 置 1 ,2,…， 
n -1 中 的 一 个 数 并 与 位 置 n - 1 中 的 数 互 换 ,等 等 . 
方法 工 的 算法 : 
Stepl : 令 P,P,,…,P, 是 1,2,…,n 的 任意 一 个 排列 (例如 :选择 P= 
J =] sn 
Step 2: 令 k=n. 
Step 3 :产生 一 个 随机 数 U, 并 令 1T= Int(kU) + 1. 
Step 4: 互 换 P, 和 P,. 
Step 5: 令 上 二 - 1, 如果 上 > 1 就 回 到 Step 3. 
Step 6: P,P,,… ,P, 就 是 所 要 的 随机 排列 . 
其 R 程序 为 
perm=function(n) | 
X=l:n;k=n 
while( k>1) | 
u=runif(1);I=foor(k*u)+l;V=X[k] 
X[k] =X[I] ;X[I] =V;k=k-1 
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上 述 算法 的 一 个 重要 性 质 是 从 整数 1;2,…sn 中 可 以 产生 有 7 个 元 素 的 
随机 子 集 . 即 按 照 这 个 算法 直到 位 置 n,n -1,…,n -r+ 1 都 填 满 数字 为 止 .在 


这 些 位 置 的 元 素 就 构成 了 随机 子 集 (在 做 这 件 事情 时 ,我 们 假设 + < 地 ;如 果 


r > 给 ， 我 们 也 可 以 找 一 个 含有 n -7r 个 元 素 的 子 集 ,并 令 不 在 此 子 集 中 的 元 


素 构成 r 个 元 素 的 随机 子 集 ). 当然 用 函数 sample(1:n) 也 很 容易 实现 。 
【 例 4.3】 (几何 随机 变量 ) 假 设 X 是 一 个 具有 参数 p 的 几何 随机 变量 ， 
即 
PIX=ij =pg '，i 之 1, 其 中 g=1-p. 
易 知 


并 1 
DPIX=d 3 SP pl, 
i=] 


产生 一 个 随机 数 U, 车 1 -yg "< U < 1 -gq, 或 者 等 价 地 ,gqg <1-U<g， 
则 令 工 =J 实际 上 ， 
pa = Int( 8 = 0)) i 
logg 


注意 到 1 -U0 也 是 服从 (0,1) 上 的 均匀 分 布 ,得 到 


X= tn +1 


即 为 具有 参数 p 的 几何 随机 变量 . 
产生 nn 个 参数 为 p 的 几何 随机 变量 的 R 程序 : 
>U=runif(n); X=floor(log(U)/log(1-p))+1 
【 例 4.4】 (Poisson 随机 变量 ( 工 ) ) Poisson 随机 变量 的 概率 函数 为 


p; = 已 下 = 让 = 人， i 
7 


用 逆 变 换 产生 此 随机 变量 的 方法 的 关键 是 递归 式 : 
区 和 A 
i+l 
利用 上 述 递归 方法 计算 Poisson 分 布 的 概率 程序 如 下 : 
p=numeric(k) 
p[1]=exp(-lambda) 
for( n in 2:r)| 
pLn]=exp( - lambda) 
for(j in0: (n -2) ) | 





Pi Pi， 工 二 0. (4, 1) 
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p[n]=p[n] * lambda/(j+l) 
| 
pln] 
| 
而 产生 带 有 均值 人 的 Poisson 随机 变量 的 逆 变 换算 法 如 下 (i 为 p =p; 的 
指标 , p; = PIX=i,F=F(i)=PIX < i ): 
Stepl :产生 一 个 随机 数 U. 
Step2: i =0,p=e*,F=p. 
Step3 ;如果 U < F, 令 =i 并 停止 . 
Step4: p+—Ap/(i+1),Fe-F+pr,it-i+l. 
Step5 :返回 Step3. 
产生 n 个 参数 为 A 的 Poisson 随机 变量 的 R 程序 : 
rpois=function( n,lambda) | 
for(j in 1:n){ u=runif(1) 
Y=rep(0,n);i=0;p=exp( -lambda) ;F =p 
while(u>=F)| 
p=lambda * p/(i+1);F=F+p;i=i+1 
| 
YIj] =i 
} 
Y 
| 
上 述 算法 连续 地 验证 了 Poisson 随机 变量 的 值 是 否 为 0, 是 否 为 1, 是否 
为 2, 等 等 . 由 此 知 ,需要 比较 的 次 数 将 比 产生 的 Poisson 的 值 大 1. 因此 ,平均 
而 言 ,上 述 将 需要 进行 1 + A 次 查找 . 然而 , 当 和 很 小 时 ,这 种 方法 是 精细 的 ， 
但 当 和 A 很 大 时 ,上 述 算法 还 可 以 极 大 地 改进 .事实 上 ,一 个 具有 均值 入 的 Pois- 
son 随机 变量 是 很 可 能 取 最 接近 入 的 两 个 整数 值 中 的 一 个 .一 个 更 有 效 的 算 
法 是 验证 这 些 值 中 的 一 个 ,而 不 是 从 0 开始 一 直 搜 寻 下 去 . 例如 , 令 了 = 
Int( 入) , 并 用 递归 式 (4.1.1) 来 确定 F(7). 现在 通过 产生 一 个 随机 数 U 来 获 
得 一 个 带 有 均值 人 的 Poisson 随机 变量 陈 , 注意 到 通过 观察 是 否 U < F(7) 来 
判断 是 否 X < 1. 如 果 针 < 7, 就 从 1 开始 向 下 查找 ,否则 从 T+ 1 开始 向 上 查 
找 . 
根据 此 算法 需要 检索 的 次 数 大 约 比 随机 变量 X 与 其 均值 A 的 绝对 差 大 
1. 因为 对 大 的 和 A 一 个 Poisson 随机 变量 (根据 中 心 极限 定理 ) 近似 为 均值 和 方 
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差 都 为 A 的 正 态 随机 变量 ,得 到 
查找 的 平均 次 数 二 1 + E[ |X -入 |] 


=1 人 ] 


=1+VAE[|Z|] (其 中 2Z ~ N(0,1)) 
= 1 +0.798VA. 
其 中 外 ~ N(A,A) 也 就 是 用 算法 (4.1.1) 平 均 检 索 次 数 的 增长 速度 等 同 于 


VA 而 不 是 和 本身 . 
【 例 4.5】 (二 项 随机 变量 ) 设 参数 (n,p) 的 二 项 随机 变量 XX 的 概率 函 
数 为 


PIX=i] = pp)" = 0 这 


Te 
则 其 递归 等 式 : 





Bs | pi =i. 
i+1l1-p 


令 pr=PIX= 计 ,F=PIX<i. 
产生 此 随机 变量 的 算法 : 
Step 1 :产生 一 个 随机 数 忆 
Step 2:c=p/(l1 ~- p),i=0,pr=(1 -pp)",F=pr. 
Step 3: 如 果 0 < F, 令 钱 =i 并 停止 . 
Step 4: pr 二 [ez -i)/(it+1)]pr,FeoF +prii+tl. 
Step 5: 返 回 Step3. 
产生 m 个 参数 为 (n,p) 的 二 项 随机 变量 的 R 程序 : 
rb=function(m,n,p) | 
Y=rep(0,m) 
for(j in 1:m)! 
c=p/(1-p);i=0;pr=(1-p)";F=Ppr 
u=runif(1) 
while(u>=F)!| 
pr=c* (n-i) * pr/(i+1);F=F+pr;i=i+l 
| 
YIj] =i 
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| 
上 述 算法 验证 了 是 否 X = 0, 然后 是 否 X=1; 等 等 .可 看 出 检索 的 次 数 比 
了 大 1. 因 此 ,平均 而 言 ,产生 需要 检索 1 + np 次 ,因为 一 个 B(n,p) 的 随机 
变量 表示 了 n 次 独立 试验 中 成 功 的 次 数 ,其 中 每 次 试验 成 功 的 概率 为 P. 这 样 
的 随机 变量 能 够 通过 减 去 一 个 B(n,1 -p) 随机 变量 得 到 (为 什么 ?). 因此 ， 


当 p > 户 时 ,我 们 能 够 产生 一 个 B(n,1 - p) 随机 变量 ,通过 上 述 方法 从 ”中 


减 去 B(n,p) 的 随机 变量 的 值 . 

附注 1 产生 一 个 B(n,p) 随机 变量 的 另 一 种 方法 是 通过 产生 个 随机 
数 U1,U,,…,U, 并 令 针 为 使 U; <p 的 U; 的 个 数 ,再 将 看 做 nn 次 独立 试验 成 
功 次 数 而 得 到 . 如 果 将 U，< p 看 做 是 第 i 次 试验 成 功 , 并 注意 到 这 个 事件 发 生 
的 概率 为 p, 就 容易 看 到 这 样 就 产生 了 一 个 B(n,p) 随机 变量 . 这 种 方法 要 求 
n 个 随机 数 并 作 n 次 比较 ,而 上 述 逆 变换 算法 仅 需 要 一 个 随机 数 ,平均 要 做 
1 + np 次 比较 . 

附注 2 ” 当 均 值 np 很 大 时 , 较 好 的 做 法 是 先 确定 产生 的 值 是 否 小 于 或 等 
于 1= Int(np), 或 者 是 否 大 于 7 在 前 一 种 情形 下 ,从 了 出 发 ,依次 检索 7- 1， 
1 - 2,…, 等 等 ;而 在 后 一 种 情形 下 ,我 们 从 1 + 1 出 发 ,依次 朝 上 检索 . 

【 例 4.6】 (多 项 分 布 ) 假设 一 个 试验 以 概率 p,,p,,… ,p, 产生 结果 1， 


2,…,r 之 一 , 且 立户 = 1. 做 次 独立 试验 ,用 天 表示 次 试验 中 出 现 结果 


的 试验 的 次 数 , 则 随机 向 量 (X,,X,,… ,X,) 服从 多 项 分 布 , 其 联合 概率 函数 
为 


nl! . x Sr 
ee DPI Pa2“ Pi， 3 = 
re i=1 


PIE: = ,2 = i 
模拟 此 随机 向 量 的 方法 依赖 于 r 入 的 大 小 . 

如 果 r 相对 nn 来 说 较 大 ,在 这 些 试验 中 很 多 结果 不 会 出 现 , 则 最 好 的 方 
法 : 

Step 1: 产 生 独 立 的 随机 变量 Se A A 使 得 PlY 二 i = Pi， i = Ll; 
2 ,…,r， 了 = 1,2,…, 几 

Step 2: 令 不 = 表示 对 也 =i j= 152,…,n, -=-1,2,…,r 的 计数 . 

产生 m 组 多 项 分 布 随机 向 量 的 R 程序 为 

exam4 6_1 =function(m,n,r,p)| 
X=matrix(0,nrow=m,ncol=r) 


for(iinl:m)| 
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Y=sample(1:r,n,prob=pireplace=TRUE) 
# replace=TRUE 表示 可 重复 抽样 
for(j in 1:r) | 
X[i,j] =length(Y[Y= =j]) 


| 
如 果 n 相对 于 7 较 大 , 则 XX,,X,,…,X, 能 依次 模拟 得 到 ;其 方法 为 
Step 1: 产生 服从 分 布 B(n,p,) 的 随机 变量 X, 的 值 x. 


Step 2: 产 生 服从 分 布 Bn - x, 全 一) 的 随机 变量 X, 的 值 


Step 3 产生 服从 分 布 Bn 一 Eup 一 Er) ] 的 随机 变量 X,_， 





的 值 x,_,. 
r-l 
Step 4: 令 ,=n - PR 
i=1] 


则 三 = (x ,x,,…,%,) 就 是 所 要 的 多 项 分 布 的 随机 向 量 . 此 算法 的 原理 如 下 : 
天 | 三 汪汪 | 天 = wi se 
P|¥%, Sw | 
产生 m 组 多 项 分 布 随 机 向 量 的 R 程序 为 
ploy =function(m,n,r,p)| 
X=matrix(0,ncol=r, nrow =m) 
for(iin 1:m) | 
X[i,l]=rbinom(1,n,p[1]) 
for(j in 2:(r-1) )| 
X[i,j] =rbinom(1,n=sum(X[i,1:(j=1l)])， 
plj]/(1-sum(p[1:(j-1)]))) 
| 
X[i,r]=n-sum(X[i,1:(r-l)]) 
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2. 连续 型 随机 变量 情形 

设 U 是 (0,1) 上 的 均匀 随机 变量 .对 任何 连续 分 布 函 数 下 , 定义 随机 变量 
X 为 

X=F"'(U), 

则 天 有 分 布 函数 书 

上 述 论断 成 立 的 原因 如 下 : 

记 F 为 X=F"(U) 的 分 布 函数 . 则 

F(x)=PIX<zx} = PIT <x} =PIU < F(x)} = F(x). 

【 例 4.7】 设 连续 型 随机 变量 X 的 密度 函数 为 

eh% < i=0 2 m= 1, 
p= | 册 


0, 其 他 . 
其 中 6 > 0，a ca < 和 < … < z=b (a,b 可 为 无 穷 ), | p(z)dz =1. 


令 P， = p(x) dz, i=1,23" Rs 则 对 任意 x, 令 i= max|7:xi <x| 四 有 


F(x)=p, +c(x 一 Xi). 
由 F( 卫 ) = 也 可 解 出 





过 三 骆 二 


此 处 i 满足 p; < UV < Pt 其 算法 如 下 : 

Step 1 :产生 随机 数 U. 

Step 2: 确 定 i, 使 p, < U < Pi 

Step 3: 计 算 x=x,+(U-p,)/ec. 

这 个 例子 的 随机 变量 在 第 7 章 中 进行 模拟 识别 时 要 用 到 . 

【 例 4.8】 (指数 随机 变量 ) 设 XX 是 参数 为 1 的 指数 随机 变量 , 则 其 分 布 
函数 为 

F(x)=1—-e. 
令 x=F (wu), 则 w=F(x)=1-e“*, 进 而 有 
X =- log(1 -wu). 

其 算法 为 :生成 一 个 随机 数 UV 并 令 X=F"'(U)=- log(1 - U) , 即 产生 出 
参数 为 1 的 指数 随机 变量 . 注意 到 1 - UV 也 是 (0,1) 上 的 均匀 分 布 , 故 
-log(1 - U) 和 -logU 有 相同 的 分 布 .也 就 是 ,一 个 随机 数 的 负 对 数 服从 参 
数 为 1 的 指数 分 布 . 

又 注意 到 当 X 是 均值 为 1 的 指数 随机 变量 时 ,对 任何 常数 c, cX 是 均值 为 
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< 的 指数 随机 变量 . 从 而 一 个 参数 为 A ( 均值 为 于 的 指数 随机 变量 能 够 通过 
随机 数 U 并 令 
=- TlogU 
得 到 . 
【 例 4.9】 (Poisson 随机 变量 ( 了 ) ) 在 第 1 章 中 介绍 过 , 当 两 个 相继 的 事 
件 的 间隔 时 间 是 独立 的 且 服 从 参数 为 A 的 指数 分 布 时 ,这 些 事件 出 现 的 个 数 


就 构成 一 个 参数 为 A 的 Poisson 过 程 . 那么 到 时 刻 1 出 现 的 事件 数 N(1) 服从 
均值 为 A 的 Poisson 分 布 . 如 果 我 们 令 X,,i=1,2,… 表示 相继 两 个 事件 的 时 间 


间隔 ,那么 第 n 个 事件 发 生 的 时 刻 为 Tx, 所 以 到 时 刻 1 发 生 的 事件 数 为 


N(CH max {n: 安 二 和 1] 二 
我 们 能 够 通过 生成 随机 数 U, vr 4Us 并 令 


N =max{n: > 一 TlogU, < 1} 
f=1 


=max {n: 》 logU. 宇 - A} 
i=1 
区 二 


=max{n:log( U,U,*…U.) A} 
=max{n:UU,:…U, > e™*} 
而 得 到 NN = N(1) 一 一 带 有 均值 的 Poisson 随机 变量 .或 者 写 为 
| N= min{n:UU,:…U, < e -1. 
产生 个 参数 为 人 的 Poisson 随机 变量 的 R 程序 : 
pois. ex4_9 =function(n,lambda) | 
X=0 
for(i in 1:n) | 
p=runif(1);N=1 
whille( p42 =ernt -lambda) ) |p=p* runif(1);N=N+l| 
X[i] =N-1 


| 
【 例 4.10】 (Gamma 随机 变量 ) 设 X 为 Gamma (n, 和 A) 随机 变量 , 则 其 分 
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布 函数 为 
= ec-iy a 
F(x) = a dy. 
由 于 其 分 布 函数 无 显 式 的 表达 式 ,难以 直接 利用 逆 变 换 法 产生 Gamma 随机 变 
量 .因为 Camma( n, 和 A) 随机 变量 X 是 nn 个 相互 独立 的 具有 参数 和 的 指数 随机 
变量 和 ,所 以 可 利用 例 4.7 先 产 生 n 个 独立 的 参数 为 A 的 指数 随机 变量 ,再 产 
生 X. 其 算法 如 下 : 
Stepl: 产生 nn 个 随机 数 U,,U,,…,U, 
Siepy :从 沾 =- logl, : logU, logU, Lb log( UU,U.). 
其 产生 m 个 T(n,A) 随机 变量 的 R 程序 为 
Gam. ex4_10=function( m,n,lambda) | 
X=0 
for(iin 1:m)| 
U=runif(n);X[i] =-1l/lambda * sum(log(U)) 
| 
X 
| 


4.2 筛选 法 


筛选 法 最 早 由 著名 的 数学 家 John von Neumann 提出 ,由 下 面 的 介绍 可 以 
看 出 在 模拟 连续 型 随机 变量 的 情形 时 其 优越 性 更 加 明显 . 

假设 要 模拟 一 个 具有 概率 函数 {p,,i 三 01 (或 者 密度 函数 所 xz) ) 的 随机 
变量 X, 但 此 概率 函数 (或 密度 函数 ) 比较 复杂 ,那么 可 以 通过 先 模拟 一 个 随 
机 变量 Y 与 XxX 具有 相同 的 取 值 ,但 其 概率 函数 1q,,j > 0} (或 者 密度 函数 
g(x) ) 相 对 简单 ,然后 以 与 2 或 1 成 比例 的 概率 接受 此 模拟 值 , 这 样 就 
可 以 模拟 出 蕊 的 值 . 此 方法 称 为 拒绝 法 或 筛选 法 ( Rejection ) . 

特别 地 , 令 e 为 一 常数 ,使 得 


立 < c， 对 所 有 满足 p， > 0 的 j， 
或 者 
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其 算法 如 下 : 
Stepl :模拟 一 个 具有 概率 函数 |q,,j > 01 (或 者 密度 函数 g(x)) 随 
机 变量 了 的 值 ， 
Step2 :产生 一 个 随机 数 以 


Step3: 着 0 < 各 (或 者 上 0 ) , 则 令 式 = 了 并 停止 否则 回 到 Step1. 


人 

定理 4.1 委 选 算法 产生 的 随机 变量 X 具 有 概率 函数 PIX=j| =p;， j= 
0,1,…( 或 密度 函数 /(x) ) , 且 得 到 随机 变量 的 值 的 迭代 次 数 是 一 个 均值 
为 c 的 几何 随机 变量 . 

证 在 此 只 证 离散 型 情形 . 先 求 一 次 迭代 接受 j 的 概率 .首先 注意 到 


PIY -jj 被 接受 | = PIY= 放 总 楼 受 | 了 2 用 4 下 王 本 
关于 1 求 和 得 到 产生 的 随机 变量 被 接受 的 概率 为 
P| 被 接受 | = 半 五 = 二 
因为 每 次 透 代 都 是 独立 的 ,产生 一 个 具有 概率 为 上 的 值 , 所 以 所 需 的 迭代 次 
数 是 均值 为 “的 几何 随机 变量 , 故 
PIX = 用 = PiX = 站 在 第 "次 迭代 时 被 接受 | 
= 了 开 (1 - 二) ”PlY =j,j 被 接受 | 


-El 
【 例 4.11】 假设 模拟 一 个 从 1,2,… ,10 中 任 取 一 值 的 随机 变量 闻 , 其 概 
率 分 布 律 见 表 4-1. 











直接 的 方法 是 前 述 的 逆 变 换 法 , 男 一 种 方法 是 此 处 的 筛选 法 .在 此 只 介绍 
第 选 法 的 算法 , 取 随 机 变量 Y ,其 分 布 律 见 表 4-2. 
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表 4-2 Y 的 分 布 律 





取 c = max 全 =1.2. 


其 算法 如 下 : 
Step 1: 产 生 一 个 随机 数 UV, 并 令 了 = Int(10D) + 1 
Step 2: 产 生 第 二 个 随机 数 U,. 


Step 3: 若 U, < 二 令 关 = 工 并 停止 ;否则 回 到 Step 1. 


产生 此 随机 变量 X 的 个 值 的 R 程序 为 
rej. exam4_10=function(n) | 
X=rep(0,n);p=c(0.11,0. 12,0.09,0.08,0.12,0.1,0.09,0.09, 
0.1,0.1) 
for(iin 1:n)| 
repeat| 
ul =runif(1);Y[i]=foor(10*ul)+1;u2=runif(1) 
if(u2<=p[ Y[i]]/0.12) break 
| 
X[i] =Y[i] 
} 
X 
} 
【 例 4.12】 设 随机 变量 X 的 密度 为 


es 
f(x*)=7*e ，%>0, 
试 模拟 此 随机 变量 X. 
因为 很 难得 到 的 分 布 函数 的 显示 表达 式 ,所 以 用 筛选 法 . 随机 变量 
的 支撑 为 (0,% ) , 我 们 考虑 参数 为 节 的 指数 分 布 情形 , 即 考虑 密度 为 g(x) = 


二 Ee x 铺 ; 人 xz) _ > 亩 证 、 外 

3 “xp{ - 与“ ,* > 0 的 第 选 法 .为 确定 满足 *C < ,通过 计算 得 到 
RY 3 pm 过 
g(x) ”多 | 3*} ” 
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和 % 27 
易 知 c= ma 人 人 光 0} ey 
其 算法 如 下 : 
Step 1: 产 生 随 机 数 U'. 
Step 2: 令 Y=- 3log(U,). 


Step 3 :产生 随机 数 U,. 


Step 4: 如果 太 < 三 Pexp|2 - 子 直 ， 则 令 X=Y, 并 停止 ;否则 返回 到 


Step 1. 
其 R 程序 为 
Rej. exam4_12 =function(n) | 
X=rep(0,n);Y=0 
for(iin 1:n) | 
Ul=ranif(1);Y=-3* log( UI1) 
U2=runif(1) 
while( U2>1/9 x Y* *2*exp(2-2/3* Y))! 
Ul=runif(1);Y=-3* log( Ul) 
U2 = runif( 1) 
| 
受训 过于 


| 
执行 Step 1 的 平均 次 数 为 c = 各 1.8. 

【 例 4.13】 ( 正 态 随机 变量 ) 设 随机 变量 Z 为 均值 为 0 方差 为 1 的 正 态 
随机 变量 . 因为 | 2 | 的 概率 密度 为 


f(x) a 0 <% < ww, (4.2.1) 


因此 可 用 具有 均值 为 1、 密度 函 数 为 g 的 指数 随机 变量 了 来 产生 具有 密度 函 
数 为 的 随机 变量 X=|2Z|, 其 中 
g(7y)=e’, 0<y<%. 





易 知 


f(x) _ 
g(x) 


Ea 
sm 





me 
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f(x) 大 


Cc 二 max 站 
8g(%) T 


由 于 





et i ek 


当 我 们 模拟 了 一 个 具有 如 (4.2.1) 的 密度 函数 的 随机 变量 后 , 令 Z 等 可 能 
为 或 -就 可 得 到 标准 正 态 随机 变量 Z. 
产生 2 的 算法 为 
Step 1 :产生 具有 速率 为 1 的 指数 随机 变量 Y. 
Step 2 ;产生 随 机 数 U. 
Step 3: 如 果 U=< exp{ - Y= , 则 令 开 = 了 否则 返回 到 Step 1. 


Step 4: 产 生 随 机 数 U 并 令 


, U < 
2 = 
-了 了 ， 基 .US 六 
R 程序 为 
rej. exam 4_12=function(n)1 
Y=0;Z=0;X=0 
for(iin 1:n)| 
repeat | 


Ul =rnnif(1);U=runif(1);Y=-log( U1) 
if{(U<=exp(-(Y-1)’2/2) ) break 
| 
关上 计 = 
U2=runif(1) 
if(U2<=1/2) Z[i] =X[i] 
else Z[i] =-X[i] 


} 
如 果 想 产生 均值 为 方差 为 er 的 正 态 随机 变量 WW, 只 需 令 WW= 人 + 2Z. 
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还 可 以 用 极 坐标 法 产生 正 态 随机 变量 . 如 例 4. 14. 
【 例 4.14】 (Box-Muller 变换 产生 正 态 随机 变量 ) 设 X 和 了 是 相互 独立 
的 标准 正 态 随 机 变量 . 令 R 和 9 表示 向 量 (X,Y) 的 极 坐标 : 即 (图 4:1 ) 其 变换 





4-1 极 坐标 图 


为 
R* =X +Y¥, tang = 元 
易 知 站 和 了 的 联合 密度 函数 为 
| f(x,y) = Te 3 (4. 2.2) 
为 了 确定 R* 和 9 的 联合 密度 f(d,9) , 我 们 做 随机 变量 的 变换 如 下 : 
d=x’ +Yy, 利于 arctan( 之 ) 
多 
其 Jaccob 行列 式 为 
od 3d 
je Ox 97y -= 2， 
00 0 
Ox 9y 
由 (4.2.2) 知 , R* 和 9 的 联合 密度 为 
pi Ee 
2 27 


从 而 知 , Re 和 0 是 相互 独立 的 且 R 为 均值 为 2 的 指数 随机 变量 ,8 是 (0,2T) 
上 的 均匀 随机 变量 . 
首先 通过 (4.2.3) 产 生 其 极 坐 标 , 然 后 变换 到 直角 坐标 就 能 产生 一 对 独 
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立 的 随机 变量 X 和 Y. 其 算法 如 下 : 
Step 1: 产 生 随 机 数 U, 和 U;. 
Step 2: R* ==2log(U;), “0=27U;. 
Step 3: 令 
X= Reos 0 = V/- 2logU, cos(2™U,) 5 
Y= Rsing = V/- 2logU, sin(27U,). 
其 产生 2n 个 独立 的 标准 正 态 分 布 随机 变量 的 R 程序 为 
boxmuller. exam4_ 14 =function(n) {X=0;Y=0 
U1 =runif(1) ;U2=runif(1) 
for(iin 1:n)| 
X[i] =sqrt( -2 * log( Ul)) * cos(2 * pi* U2) 
Y[i] =sqrt( -2 * log( U1)) * sin(2 * pi* U2) 


(4.2.4) 


c(X,Y) 
| 
上 述 (4.2.4) 是 著名 的 Box-Muller 变换 ,也 称 为 极 坐 标 法 . 值得 注意 的 是 ,使 
用 Box-Muller 变换 (4.2.4) 需要 计算 正弦 和 余弦 三 角 函 数 ,这 是 非常 麻烦 的 . 
此 方法 比较 粗糙 ,其 改进 可 参考 Ross 的 相关 著作 . 
R 软件 为 我 们 提供 了 一 些 常用 的 分 布 ,可 以 求 其 概率 、 分 位 数 以 及 产生 随 
机 数 等 , 见 表 4-3. 


表 4-3 常用 分 布 在 R 中 的 函数 


分 布 英文 名 R 软件 中 的 名 称 



















二 项 分 布 Binomial Si 
泊 松 分 布 Poisson lambda 
几 条 分 布 Geometric prob 
超 几 何 分 布 Hypergeometric m,n,k 
均匀 分 布 Uniform min , max 
指数 分 布 Exponential rate 
正 态 分 布 Normal mean,sd 
1 分布 Student's t df ,ncp 
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续 表 






























好 分布 Chi-squared df,ncp 
F 分布 F f dfl ,df2 ,ncp 
柯 西 分 布 Cauchy cauchy location , scale 
伽 马 分 布 Gamma gamma shape,scale 
威 布尔 分 布 Weibull weibull . shape , scale 










贝塔 分 布 





Beta beta shapel , shape2 ,ncp 


在 表 4-3 中 所 列 的 分 布 中 ,参数 necp 表示 非 中 心 参数 ,默认 为 ncp=0, 表 
示 中 心 分 布 .加 上 不 同 的 前 级 表示 不 同 的 意义 : 
d ”表示 概率 密度 函数 或 分 布 律 ; 





p ”表示 分 项 丽 数 F(x) 1 

q 表示 分 布 函数 的 反 函 数 F-'(w) , 即 w 的 下 分 位 数 点 ; 
x ”表示 产生 服从 某 个 分 布 的 随机 变量 . 

例如 : 设 X ~ N(1,4), 其 密度 函数 为 /(x) = 一 ei 则 


VET 
>dnorm(0,mean=1,sd=2) # 求 密度 函数 所 0) 的 值 
>pnorm(5,mean=1,sd=2) # 求 概率 P|1T<5} 
>qnorm(0.8)  # 求 由 (-1)(0.8) , 即 0.8 分 位 点 
>rorm(m;,1,2) 。 # 表 示 产 生 m 个 分 布 为 N(1,4) 的 随机 变量 
对 于 其 他 分 布 加 上 不 同 的 前 缀 具有 相似 的 含义 . 到 目前 为 止 ,我 们 可 以 直 
接 利 用 R 软件 产生 常用 分 布 的 随机 变量 . 


4.3 合成 方法 


假设 我 们 已 有 一 个 有 效 的 方法 来 模拟 具有 概率 函数 1p 中 ,i 二 01 (或 密 
度 函 数 上 (xz) ) 的 随机 变量 X, ,i = 1,2 的 值 . 车 X 的 概率 函数 (或 密度 函数 ) 如 
下 : 

PIX= 放 =apy +(1-a)py” 或 f(x)=afi(x) + (1 -a)f(x), 
(4.3.1) 
jp1 
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其 中 0 < a < 1. 那么 令 随 机 变量 X 为 
i 入 Qt， 
ZX, ,以 概率 1 - a， 
则 X 的 概率 函数 由 (4.3.1) 给 出 .这 种 模拟 随机 变量 X 的 方法 称 为 合成 法 . 
模拟 的 算法 如 下 : 
Step 1 :产生 随机 变量 X. 
Step 2: 产 生 一 随机 变量 X,. 
Step 3 :产生 一 个 随机 数 U. 如 果 U < a, 令 了 =X; 否 则 令 针 = 了 X,. 
【 例 4.15】 设 随机 变量 X 的 概率 函数 pj,j = 5,6,…,14, 见 表 4-4. 


表 4-4 的 分 布 律 





模拟 X 的 值 的 一 个 直接 方法 是 逆 变 换 法 ,在 此 用 合成 法 对 X 的 值 进行 模拟 . 
令 p, =0.55pt + 0.45p 四 ,j=5,6,:…,14, 其 中 pW ,i=1,2 分别 为 X, 的 - 
概率 函数 , 见 表 4-5、 表 4-6. 


表 4-5 XX, 的 分 布 律 表 4-6 “已 的 分 布 律 





则 


xz- 人， 以 概率 0. 55 ， 
X,， 以 概率 0. 45. 

模拟 于 的 算法 如 下 : 

Step 1 :产生 一 个 随机 数 以. 

Step 2 :产生 一 个 随机 数 U0，. 

Step 3: 如 果 局 < 0.55, 就 令 了 = 2 Int(5U) + 5; 否则 令 
X=2Int(5U,) + 6. 
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产生 随机 变量 X 的 个 值 的 RR 程序 为 : 
comp. exam4_15 = function(n) | 
X=0 
for(iin 1:n)| 
ul =runif(1) ;u2 =runif(1) 
这 (ul<0.55 ) | 
X[i] =2 * floor(5 * u2)+5 
| 
else X[i] =2 * floor(5 * u2)+6 
| 
X 
| 
【 例 4.16】 假设 某 台 仪器 出 现 故障 而 未 能 及 时 发 现 ,或 者 在 某 一 时 刻 仪 
器 受到 外 部 环境 影响 (如 电压 突然 增 大 ) ,致使 这 部 分 观测 值 的 精度 降低 而 误 
” 差 增 大 . 在 大 多 数 情 况 下 ,仪器 的 观测 值 服从 正 态 分 布 W(b,c。 ); 少数 情形 
下 仪器 的 观测 值 服从 NGe,c )(c ”> coco) 二 如 何 模拟 出 此 仪器 的 观测 
值 ? 
不 妨 假设 此 仪器 观察 值 的 密度 函数 为 1(x) : 
f(x)=afi(x) + (1 -oa)f(x), 
其 中 ws (0;1) 由 以 往 记 录 确 定 , 且 











Pies ze- 机 } , 


模拟 X 的 算法 为 
”Step 1: 产 生 服 从 N(9,o。” ) 的 随机 变量 ,. 
Step 2: 产 生 服从 N(9,o”) 的 随机 变量 X. 
Step 3 :产生 随机 数 U. 
Step 4: 若 U < a, 令 对 = 无 ;否则 令 针 = XX,. 
模拟 此 仪器 n 个 观测 值 的 R 程序 为 
comp. exam4_16 =function(n,a,0,00,o)| 
X=0 
for(iin 1:n)| 
Xl=rnorm(1,0,00);X2=rnorm(1,0,0) 
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UrinifC1) 
i(U<=a) {X[i] =X1 
| else {X[i] =X2} 


X 
| 


4.4 Poisson 过 程 模拟 


1. 齐 次 Poisson 过 程 模拟 

假设 要 模拟 速率 为 和 A 的 Poisson 过 程 的 前 个 事件 发 生 的 时 间 . 已 知 在 
Poisson 过 程 中 两 个 相继 事件 之 间 的 时 间 间 隔 服 从 参数 为 A 的 指数 分 布 , 从 而 
产生 这 个 过 程 的 一 种 方法 是 产生 出 这 些 间 隔 时 间 . 如 果 产 生 nn 个 随机 数 VU,， 


Nn logU,, 则 X, 就 可 看 做 是 Poisson 过 程 在 第 i - 1 与 第 i 
个 事件 之 间 的 时 间 间 隔 . 因为 第 /个 事件 来 到 的 时 刻 等 于 前 7 个 事件 的 时 间 间 
隔 之 和 ,所 以 就 得 到 了 前 ”个 事件 来 到 时 间 的 值 为 5 = 字 ,j= 1,2,… on 

现在 要 模拟 Poisson 过 程 在 时 刻 了 前 所 发 生 的 每 个 事件 的 时 间 ,那么 我 们 
也 能 够 按 上 述 方法 产生 相继 事件 发 生 的 时 间 间 隔 且 当 它们 的 和 超过 了 时 就 停 
止 的 方法 进行 模拟 . 令 1 表示 时 间 , 1 表示 到 时 刻 t 发 生 的 事件 数 , 5S(7) 表示 
最 近 发 生 的 事件 的 时 间 . 则 算法 如 下 : 

Step 1:t=0, T=0. 

Step 2: 产 生 随机 数 以 


Sa 汪汪 TlogU ;车 + > 7, 则 停止 . 


Step 4: Te—1+1,S(1)=i. 
Step 5: 返 回 到 Step 2. 
在 上 述 算 法 中 了 的 最 后 一 个 值 表 示 到 时 刻 7 时 事件 发 生 的 个 数 , 且 
S(1),S(2),…,S(7) 是 第 1 个 事件 依次 发 生 的 时 间 . 
模拟 参数 为 lambda 的 在 时 刻 7 前 的 Poisson 过 程 状 态 的 R 程序 为 : 
pois. procl =function(T ,lambda) | 
t=0,1=058=0 


repeat | 
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U=runif(1) 
t=t-l/lambda * log(U) 
if{(t>T) break 
I=I+1 
S[I] =t 
| 
list(S=S,I1=1) 
| 
根据 第 一 章 的 附注 1 可 以 得 到 另外 一 个 模拟 Poisson 过 程 在 了 时 刻 前 各 
个 事件 发 生 的 时 刻 的 有 效 方法 . 令 N(T) 表示 到 时 刻 了 所 发 生 的 事件 总 数 . 由 
第 一 章 知 其 算法 如 下 : 
Step 1 :产生 参数 为 A7 的 Poisson 随机 变量 N(7) 的 值 n. 
Step 2: 产 生 (0,7) 上 均匀 分 布 随机 变量 的 于 个 值 : Ti,7,,… ,7,. 
Step 3 :将 7, ,7,,… ,7, 排序 . 
附注 3 在 此 方法 中 , 若 入 很 大 就 用 例 4.4 的 方法 产生 W(7T) 的 值 ,如 果 
A 不 大 就 用 例 4.9 的 方法 产生 N(7) 的 值 . 
模拟 参数 为 A 的 在 时 刻 了 前 的 Poisson 过 程 状态 的 -R 程序 为 : 
pois. proc2 = function(T,lambda ) | 
N=0;S=0 
i=0;p=exp(-lambda * T);F=p 
u=runif(1) 
while(u>=F) | 
p=lambda * T* p/(i+1);F=F+p 
i=i+1 
| 
N=i 
U=runif(N) 
S=sort(T*U) 
list(N=N,S=S) 
| 
也 可 以 利用 R 函数 直接 产生 N(7T), 上述 程 序 改写 为 
pois. proc3 =function(T ,lambda) | 
S=0 
N=rpois(1,lambda * T) 








4 统计 模拟 及 其 RR 实现 ， 


U=runif(N) 
S=sort(T*U) 
list(N=N,S=S) 
} 
【 例 4.17】 假设 某 银 行 的 营业 时 间 为 早上 8:00 到 下 午 5:00 共 9 个 小 
时 ,顾客 按照 参数 为 和 = 3 人 /小 时 的 Poisson 过 程 来 到 银行 . 试用 模拟 的 方法 
得 出 银行 在 某 一 天 来 到 的 顾客 数 和 每 位 顾客 到 达 的 时 间 。 
解 ”可 以 调用 上 述 的 任何 一 个 程序 ,如 调用 第 一 个 : 
>pois. procl1(9 ,3) 
$ S 
[1] 0.0192087 0. 2367797 0. 9466212 1. 0905208 1. 7701686 1.7952087 
1.8244874 
[8] 2.1662139 2. 6953013 2. 7672339 3. 7728436 3. 7805311 3. 7821376 
4.3271704 
[15] 4.4634007 4. 6937963 5. 1886387 5. 8120959 6. 2018235 6. 2235077 
6.8783518 
[22] 7.1107778 7.2659268 7.4430771 7.5904169 8.0473991 8. 1961518 
8.2614421 
[29] 8.8433114 
$I 
. [1] 29 
2. 非 齐 次 Poisson 过 程 模拟 
假设 我 们 要 模拟 具有 强度 函数 A(:) 的 非 齐 次 Poisson 过 程 在 时 刻 了 前 各 
个 事件 发 生 的 时 刻 . 可 用 稀释 法 或 随机 抽样 法 来 实现 . 也 就 是 ,首先 选择 一 个 
和 A 使 得 A(i) < A,t 志 7, 产生 出 参数 为 人 的 Poisson 过 程 在 时 刻 了 前 的 事件 


数 ,然后 以 概率 4 对 所 产生 的 事件 个 数 进行 计数 , 则 被 计数 事件 的 过 程 是 


一 个 具有 强度 函数 A(i) ,0 和 上 二 了 的 非 齐 次 Poisson 过 程 . 由 此 我 们 能 够 得 到 
模拟 非 齐 次 Poisson 过 程 在 时 刻 了 前 各 个 状态 的 算法 : 

Step 1:1t=0,1=0. 

Step 2: 产 生 一 个 随机 数 U. 

Wop 人 logU ;如 泉 1 > 7, 则 停止 . 


Step 4: 产 生 一 个 随机 数 U. 
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Step 5: 如 果 U < 和， 令 1 一 1+ 1 S(T) mY 


Step 6: 返 回 到 Step 2. 
模拟 非 齐 次 Poisson 过 程 在 时 刻 了 前 各 个 状态 的 R 程序 : 
nonpois. thinl =function (lambdat,lambda,T) | 
t=0;I=0;S=0 
repeat | 
U=runif(1) 
t=t-1l/lambda * log( U) 
if(t>T) break 
Ul =runif(1) 
if(Ul<=lambdat(t)/lambda) | 
I=I+1;S[I] =t 


| 
list(1=1,S=S) 
} 

在 上 述 步 骤 中 , A(t) 是 强度 函数 , A 满足 A(t) < A. 那么 1 最 后 的 值 表 
示 到 时 刻 上 事件 发 生 的 个 数 , 5S(1) ,5S(2) ,…,S(7) 是 事件 发 生 的 时 间 . 

如 果 A(5 在 (0,7) 整个 区 间 上 都 接近 A, Step 5 就 很 容易 实现 , 则 此 算 
法 就 很 有 效 . 在 实际 中 , Ai) 在 (0,T) 上 不 一 定 都 接近 于 入 , 利用 和 (i) 的 连 
续 性 将 (0,7) 分 为 若干 个 子 区 间 ,然后 在 每 个 子 区 间 上 用 这 个 算法 . 也 就 是 ， 
确定 合适 的 k, 令 0=i < < < <1<bl=7T，A Ai 使 
得 

A(s) A， 车 ts<t, i=1l,,k+l. (4.4.1) 
首先 注意 到 事实 : 
如 果 在 上 e (t,_1,t;) 时 产生 一 个 具有 速率 和 ;的 指数 随机 变量 处 , 使 得 t+ 


X > 5， 那么 我 们 可 以 证 明 2 一 后 一 中 了 是 速率 为 入 .1 的 指数 随机 变量 
在 区 间 (0,4,] 上 产生 参数 为 A, 的 齐 次 Poisson 过 程 各 个 事件 的 时 间 , 并 
以 概率 Ai 接受 . 利用 上 述 事实 及 指数 分 布 的 无 记忆 性 ,可 以 产生 参数 为 A 


的 Poisson 过 程 在 (5 5] ,i =2,…,k + 1 上 的 各 个 事件 的 时 间 . 
令 t 表 示 当 前 的 时 间 , J 表示 当前 的 区 间 ( 即 当 t, < 1 < i 时 ,=7),1 表 
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示 事 件 发 生 的 次 数 以 及 5(1) ,S(2),…,S(7) 发 生 的 时 间 , 则 产生 非 齐 次 
Poisson 过 程 在 时 刻 了 前 状态 的 算法 为 
Step l:t=0, J=1, I=0. 


Step 2 :产生 一 个 随机 数 UVU, 并 令 对 =- TlogU. 
ji 


Step 3 :如 果 t + 著 > t, 跳 到 Step 8. 
Step 4: 上 一 + 不 . 


Step 5 :产生 一 个 随机 数 U. 


Step 6: 如 果 二 三 A(， 令 11+1，5S(CD= 
J 


Step 7: 返 回 到 Step 2. 

Step 8 :如 果 J = 上 + 1, 则 停止 . 

(XX-i, +i)A), 
Aj,i 
Step 10 :返回 到 Step 3， 

其 R 程序 为 

nonpois. thin2 =function( laf,T,k,n) | 


Step 9: = t=t,,J—-J+l. 


lamax = function(k,n,a){ lab=0 
b=seq(0,a,by=a/k) 
for(iin 1:k) | 
# 如 果 by=1/k, 则 有 a* 上 个 区 间 , 不 止 k 个 区 间 ! 
lab[i] =max(laf(seq(b[i],b[i+1] ,by=(b[i+1]-b[i] )/n))) 
} 
lab 
| 
la=lamax(k,n,T) 
a=seq(0,T,T/k) 
t=0;1=0;S=0;]J=1 
U=runif(1);X=-1/la[ J] * log(U) 
repeat | 
while(t+X<=a[ J+1])| 
t=t+X;Ul=runif(1) 
if( Ul<=laf(t)/la[l J])!1 
I=I+1;S[1]=t 
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| 
U=runif(1);X=-1/la[J] * log( U) 
| 
J=J+1l 
这 (J= =k+1l ) break 
X=(X-a[J]+t) * la[f J-1]/la[l J] 
t=a[] 
| 5 
list(I=I,S=S) 
} 
再 注意 到 如 下 事实 : 
如 果 在 时 刻 s 发 生 的 事件 与 ;前 发 生 的 事件 是 独立 的 ,到 下 一 个 事件 发 生 
的 时 间 有 分 布 ,如 下 : 

F(x) =P{ 从 时 刻 s 到 下 一 个 事件 发 生 的 时 间 不 超过 * | 在 时 刻 s 有 事件 发 生 | 
=P| 下 一 个 事件 在 时 刻 x + s 之 前 发 生 | 在 时 刻 * 有 事件 发 生 | 
=Pi 事 件 在 时 刻 * 和 * + s 之 间 发 生 | 在 时 刻 * 有 事件 发 生 | 
=P| 事 件 在 时 刻 s 和 % + * 之 间 发 生 | 由 独立 增 量 性 
=1 - P| 没 有 事件 在 时 刻 s 和 x +s 之 间 发 生 | 


=1 - exp( 过 fa) 


=1 - exp(- Als +y)dy) (4.4.2) 


由 (4.4.2) 从 分 布 产生 随机 变量 5 , 再 从 分 布 ,产生 X,, 令 5, =s, +X,， 
等 等 ,就 可 得 到 各 个 事件 发 生 的 时 间 5, ,5,,…. 这 又 是 一 种 模拟 强度 为 A(1) 
的 非 齐 次 Poisson 过 程 在 时 刻 了 前 的 各 个 状态 的 方法 . 


【 例 4.18】 模拟 强度 函数 为 A(1) = st > 0 的 Poisson 过 程 在 前 10 


个 时 间 单 位 的 各 个 状态 . 
由 于 
由 (4.4.2) 知 ， 
PS 





s+%+5 st%x+5 
令 凡 =F,(x), 则 有 
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WY x 
s+xX+5’ 


即 
_u(s+5) 
sh 
其 算法 如 下 : 
Step 1: 产 生 随 机 数 U, 令 5， = a 
Step 2: 若 S，> 7 了 7, 则 停止 ,输出 S1 ,5,,…,5S, 1 及 i-1. 
i (Si1 +5)U 、 
Step 3 :否则 产生 随机 数 U, 令 ii+1 且 5;= Si + 一 上 卫 一 逆 一, 返回 
Step 2. 
其 R 程序 为 
exam.4.18=function(T) | 
U=runif(1) 
S=5* U/(1-U) 
i 
repeat | 
if( S[i] >T)break 
i=i+1 
U=runif(1) 


S[i] =S[i-1]+U * (S[i-1]+5)/(1-U) 
| 
list(S=S[1:i-1],I=i-1) 
} 

调用 函数 exam. 4. 18(10) 得 到 结果 如 下 : 
$ S 
[1] 3.378451 4.997666 
$I 
[1] 2 


4.5 ”Markov 链 的 模拟 
在 1.4 节 中 已 介绍 了 Markov 链 的 概念 及 相关 性 质 . 本 节 我 们 将 介绍 如 何 


模拟 一 个 不 可 约 的 已 知 状态 和 转移 阵 的 Markov 链 . 设 不 可 约 Markov 链 丰 = 
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|X,,n = 0,1,…| 的 状态 空间 为 8 ,转移 概率 矩阵 P = (p,,),.。 其 算法 为 


Step 1 :任意 给 定 初始 值 X =xo,xo esS. 
Step 2: 从 给 定 X, = x, 的 条 件 分 布 P =x | 和 = 和 | 中 产生 XX 


的 值 %,,,. 从 而 就 得 到 了 此 Markov 链 的 一 个 实现 zxo ,zi ，…,xnw 
【 例 4.19】 模拟 一 个 具有 状态 空间 S = ( - % ,wm ) 且 转 移 核 
1 -2 


= ,一 一 e 


把 护 
i mr 
的 Markov 链 . ’ 
根据 转移 核 知 和 | X, = x。~ N(0. 5%, ,1), 进而 有 
寻 a _ fxo 5 
全 = xo = fp'.1x |x, = % |} po {x | 和 = xo} dxi = 名 ,了 ? 
Xo 21 


| 交加 = xo|} = [ps1x |X, = %2 | Pos {%3 | 和 = zj dx, =NG8 15)， 


Pi lz | Xo = xo| = fp | 1 = Xi | po 上 3 | 乞 = xo | dx 


各 4 圳 
2 34 





=A|( 


可 以 看 出 ,条 件 密度 函数 收敛 到 N(0,3) , 表明 此 Markov 链 是 平稳 的 ， 


其 平稳 分 布 为 M(0,3 ] ， 
下 面 我 们 给 出 模拟 此 Markov 链 的 步骤 :首先 确定 初始 值 X ,= 0, 然后 从 
N(0. 5x, ,1) 中 产生 小 ,,,, 即 可 得 到 此 链 的 一 个 实现 : 其 R 程序 为 
exam4. 19 =function( x0 ,m) | 
X=x0 


for(iin 2:m)| 
X[il=morm(1,0.5 * X[i-1],1) 


| 
运行 exam4. 19(0 ,1000 ) 就 可 得 到 此 Markov 链 的 一 个 实现 . 


为 了 判断 初始 值 对 Markov 链 的 将 来 状态 的 影响 ,我 们 分 别 取 由 初始 值 
-5,0,5 产生 的 Markov 链 的 三 条 实现 ,作出 图 4-2. 由 图 4-2 可 看 出 ,尽管 此 


Markov 链 的 初始 值 有 很 大 差别 ,但 经 过 一 段 时 间 后 ,其 实现 趋向 于 一 致 . 
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图 4-2 不 同 初始 值 的 Markov 链 的 实现 


练 习 4 

1. 用 逆 变 换 法 编写 产生 下 述 随机 变量 的 程序 : 
X 0 1 

p | 0.4 0.6 


模拟 n = 10000 次 ,并 确定 随机 变量 的 值 为 0 的 比例 。 
2. 用 北 变 换 方法 生成 如 下 密度 函数 的 随机 变量 ,要 求 写 出 R 程序 : 


(1) fx) = 一， > 


(2) /(z) = 了 erp[ -三 (> -2)] ,>2; 
(3) f(x)=4x(1 -x),0 <x<l1; 


.0 i exp( — %) 一 0 bd oo 
(4) Logistie 分 布 /4) = 0 <x< 
Rk 
nT(l+x)’ 


(5) Cauchy 分 布 f(x) = 





(6) Ho) = 0<r<l. 


3. 用 逆 变 换 方法 生成 如 下 概率 函数 的 随机 变量 ,要求 写 出 R 程序 : 
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1 3 
NT PR EN i=0,1,2, ?了 3 


X 1 2 3 4 5 
(2) 
p 0.1 0:2., :044.80#2% 0 
4. 给 出 产生 具有 以 下 分 布 函 数 的 随机 变量 的 算法 及 程序 : 
F(x)=1 -exp(-ax), 0O<x<o%. 
具有 上 述 分 布 的 随机 变量 称 为 Weibull 随机 变量 . 
5. 用 筛选 法 来 模拟 如 下 密度 函数 的 随机 变量 , f(x) 是 需要 模拟 的 随机 变 
量 的 密度 函数 , g(x) 是 其 对 应 的 筛选 函数 。 
(1) Kx)=x(1-x)，0<x<1， g(x) 为 常 值 函数 ; 


(2) fx) =exp( -3*) ,es) (1+); 


下 
一 


(3J xy = exp Ts g(x) Ce Os : 


(4) f(x) = exp( -地 ， X00, g(x%) 开 xexp| - 村 (2 0)| . 


6. 编写 例 4.4 中 用 向 上 和 向 下 搜寻 法 产生 Poisson 随机 变量 的 程序 ,并 在 
A 较 大 时 ,比较 它们 的 运算 效率 . 

7. 令 是 一 个 均值 为 1 的 指数 随机 变量 . 给 出 一 个 有 效 算法 来 模拟 一 个 
随机 变量 ,其 分 布 函 数 为 给 定 了 < 0. 05 条 件 下 的 X 的 条 件 分 布 .也 就 是 它 的 
密度 函数 为 


f(#)= es, 0 <x < 0.05. 


产生 100 个 这 样 的 随机 数 并 用 它们 来 估计 E[X|X < 0. 05]. 
8. 给 出 模拟 一 个 具有 概率 函数 已 ，J=5,6,…,14 的 随机 变量 的 方法 ,其 
中 
-人 11, 当 j 是 奇数 且 5 < j < 13 ， 
” 【0. 09, 当 j 是 偶数 有 6 < j < 14. 
9. 假设 随机 变量 半分 别 依 概率 0. 06 ,0. 06 ,0. 06 ,0. 06 ,0. 06 ,0. 15 ,0. 13 ， 
0. 14,0. 15 ,0. 13 取 值 1,2,… ,10. 用 合成 方法 产生 的 值 . 
10. 给 出 产生 具有 下 述 密度 函数 的 随机 变量 的 两 种 算法 : 
f(x)=xe , 0<x<oo， 


并 比较 其 有 效 性 . 
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11. 假设 要 通过 具有 速率 和 的 指数 筛选 法 来 产生 密度 函数 如 下 的 随机 变 
量 工 : 


Ha) = er， x > 0， 


那么 确定 和 的 值 使 得 用 来 产生 式 的 此 算法 的 迭代 步 数 的 期 望 值 最 小 . 

12. 给 出 产生 具有 下 述 密度 函数 的 随机 变量 的 一 种 算法 : 

f(x) = 30(x’ - 2x’ + 入 )， 0O<x<1. 
讨论 此 算法 的 有 效 性 . 

13. 一 个 意外 伤亡 保险 公司 有 1000 个 客户 ,每 个 客户 独立 地 在 下 个 月 以 
概率 0.05 索赔 . 假设 索赔 量 是 独立 的 具有 均值 $ 800 指数 随机 变量 . 用 模拟 
方法 估计 这 些 索赔 量 的 和 超过 $ 50000 的 概率 . 

14. 为 了 完成 一 项 工作 ,一 个 工人 必须 要 依次 经 过 上 个 阶段 . 完成 阶段 i 
的 时 间 是 具有 速率 A,,i = 1,2,…,k 的 指数 随机 变量 ,那么 在 完成 阶段 i 后 ,此 
工人 以 概率 a,i=1,2,…,k -1 进入 到 下 一 个 阶段 . 也 就 是 ,在 完成 阶段 i 后 ， 
此 工人 以 概率 1 - a; 停止 工作 . 如 果 我 们 令 站 表示 此 工人 用 在 工作 中 的 时 间 
量 , 那 么 XX 就 称 为 Cox 随机 变量 . 写 一 个 产生 此 随机 变量 的 算法 . 

15. 公共 汽车 按照 每 小 时 5 辆 的 Poisson 过 程 到 达 一 个 运动 会 场所 . 每 辆 
\ 共 汽车 等 可 能 地 包含 或 者 20 ,或 者 21,… ,或 者 40 个 运动 爱好 者 ,在 不 同 的 
共 汽 车 中 运动 爱好 者 的 人 数 是 独立 的 . 写 一 个 算法 来 模拟 到 时 刻 上 = 1 时 这 
运动 爱好 者 的 到 达 人 数 . 
16.〈(1) 写 一 个 用 稀释 法 产生 具有 如 下 强度 函数 的 Poisson 过 程 的 前 10 个 
时 间 单 元 的 程序 : 


心 


版 六 


4 
1i) = 3 + 一 一 一 ; 
A(s) ter 


(2) 对 上 述 例子 给 出 一 个 改进 了 的 稀释 法 的 算法 . 
17. 假设 Poisson 过 程 的 强度 函数 为 
Ai = 时 。 
1+5(t-5), 5 <t< 10. 
模拟 此 Poisson 过 程 在 10 个 单位 时 间 前 发 生 的 各 个 事件 的 时 间 . 
18. 模拟 一 个 具有 状态 空间 8 = ( - % ,% ) 且 转 移 核 


= ray 
天 =%e “人 


0 «tx 3, 


的 Markov 链 . 
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~ 第 避 章 二 
估计 精度 与 有 效 模拟 次 数 


在 统计 学 中 ,通过 对 实际 问题 进行 观测 得 到 若干 值 后 ,就 要 对 我 们 所 感 兴 
趣 的 未 知 参数 9 进行 估计 ,但 往往 达 不 到 指定 的 精度 ,这 时 就 需要 再 进行 大 量 
的 抽样 ,为 了 避免 大 量 抽样 带 来 的 困难 ,这 时 就 需要 进行 计算 机 模拟 . 通过 模 
拟 可 以 确定 在 一 定 的 信和 度 下 要 达到 指定 的 精度 所 需要 抽样 的 容量 . 下 面 就 对 
这 些 内 容 进行 介绍 . 


5.1 总 体 均 值 和 总 体 方差 


假设 ,X，…,X, 是 独立 同 分 布 的 随机 变量 . 令 9 和 o 分 别 表示 其 均值 
和 方差 , 即 ,9 = ELX] 以 及 oz= Var 所 ) 仿 天 = 加 表示 这 个 数据 的 算 
术 平均 值 , 也 称 为 样本 均值 . 当 总 体 均值 6 未 知 时 ,我 们 经 常用 样本 均值 对 之 
进行 信 计 . 易 知 E 了 =0 及 E[( 庆 -0)*] = 邱 ， 当 中 很 小 时 , 它 表 明天 是 6 的 
一 个 好 估计 

由 于 总 体 方差 0? 通常 是 未 知 的 ;所 以 很 难 直接 用 -的 值 作为 衡量 严 个 


数据 的 样本 均值 估计 总 体 均值 的 误差 标准 ,从 而 需要 估计 ”我 们 往往 用 样 
本 方差 
1 


n-l 


Ss? 





D(X - H)? 
估计 0 ,而且 易 知 ES* = o*. 有 时 用 样本 标准 差 $ 作为 总 体 标准 差 o 的 估计 ， 


或 者 用 样本 标准 误差 2 作为 总 体 标准 误差 全 的 估计 . 
\ 原 Vn 
假设 已 经 拥有 若干 个 万 的 值 ,如 果 我 们 的 目标 是 估计 9 = E[X,] , 并 且 要 
保证 在 给 定 的 置信 度 1 - a 下 达到 指定 的 精度 ,那么 我 们 将 要 产生 多 少 新 数据 
呢 ? 解决 此 问题 的 方法 是 ,首先 选择 一 个 合适 的 正 数 d, 例如 ,如 果 d 是 估计 
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量 式 的 标准 差 ,我 们 能 够 以 95% 的 可 靠 性 确定 了 与 9 的 差 不 超 过 1.96d. 我 们 
将 继续 产生 新 的 数据 ,直到 产生 了 个 数据 的 值 使 得 其 样本 标准 误差 二 < 


确定 何 时 中 止 产生 新 数据 的 算法 如 下 : 
Step 1 :选择 一 个 合适 的 值 4 作为 估计 量 的 标准 误差 . 
Step 2: 至 少 产生 100 个 数据 . 


Step 3 :继续 产生 新 的 数据 , 当 达 到 k 个 数据 且 证 < d 时 停止 ,其 中 5 是 根 
据 这 上 个 数据 确定 的 样本 标准 差 
step 4: 9 的 估计 量 为 了 = 交 a 


【 例 5.1】 连续 产生 标准 正 态 随机 变量 直到 个 为 止 ,其 中 n> 100 且 满 
是 二 < 0.01, 其 中 5 是 此 "个 数据 值 的 样本 标准 差 . 同 n 为 多 少 ? 


我 们 编写 程序 如 下 : 
exam5. 1 = function(d) | 
X=morm(100) ;k=100 
while( sd(X)/sqrt(length(X))>=d)1 
k =k+1 
X[k]=rnorm(1) 


k-1 
} 
并 调用 exam5.1(0.01) ,就 可 得 到 n = 9956. 


因为 上 述 算法 对 每 次 产生 的 新 数据 都 需要 重新 验算 二 < d, 这样 就 会 影 


响 运 算 速度 ,我 们 对 此 算法 进行 改进 . 
考虑 序列 | wR 9 并 令 

四 

名 了 
以 及 

2 1 (4 一 守 )? x 
Si = by i J 二 2 

分 别 表示 前 j 个 数据 的 样本 均值 和 样本 方差 . 下 述 递归 方法 用 来 连续 地 计算 
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样本 均值 和 样本 方差 的 流动 值 . 
邻 S,* =0,X,=0. 
ST 2 人 的 5 到 
和 J+1l 
ea -二 S52 (5.1.2) 
J 


【 例 5.2】 ( 续 例 5.1) 用 改进 了 的 算法 对 例 5. 1 进行 编程 : 
exam5.2=function(d) | 
X=rnorm(100);k=100 
ss=0;xbar=X[1] 
# 下 面 的 for 循环 产生 前 100 个 均值 和 方差 
for(j in 1:(k-1))!| 
xbar[ j+1l1] =xbar[j]+(X[j+1]-xbar[j] )/(j+1) 
ss[j+1] =(1-1/j) * ss[j]+(j+1) * (xbar[j+l1]-xbar[j])” 


# 下 面 的 repeat 循环 通过 递归 来 产生 100 个 数据 以 后 的 均 
值 和 方差 
repeat | 
k=k+1l 
X[k]=rnorm(1) 
xbar[ k ] =xbar[k-1]+(X[k]-xbar[ k-1])/k 
ss[k]=(1-1/(k-1)) * ss[k-1]+k* (xbar[k]-— 
xbar[k-1])” 
if( sqrt(ss[k] )Xsqrt(length(X))<d)break 
| 
list(xbar=mean(X) ,N=k,Var=ss[k]) 
} 
通过 运行 下 述 程 序 测算 ， 
>system. time( exam5.1(0.01) ) 
用 户 系统 流逝 
3.78 0.00 3.86 
> system. time(exam5.2(0.01)) 
用 户 系统 流逝 
2.67 0.00 2.70 
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对 同样 的 精度 d = 0.01, 例 5.2 比例 5.1 快 将 近 30%. 

如 果 随机 变量 的 方差 是 其 期 望 的 函数 ,例如 Bernoulli( 或 0-1) 随 机 变量 ， 
模拟 时 对 上 述 算法 就 需要 修正 . 即 ,假设 产生 随机 变量 使 得 

和 -下 以 概率 p， 
”lo0o， 以 概率 1 - p， 

并 假设 我 们 对 估计 p 感 兴趣 . 因为 Yar(X,) =p(1 - p), 所 以 不 必 利 用 样本 方 
差 估计 Var(X,). 很 自然 地 ,方差 Var(X,) 的 估计 为 X.(1 -XX,). 对 此 ,我 们 用 
下 述 方法 确定 何 时 停止 . 

Step 1 :选择 一 个 合适 的 d 作为 估计 量 的 标准 误差 . 


Step 2: 连 续 地 产生 新 的 数据 ,直到 产生 上 个 数据 使 得 [2 <] ”< 


d 时 就 停止 . 
Step 3: 计 算 p 的 估计 量 蕊 . 
【 例 5.3】 假设 抛 一 枚 硬币 ,出 现 “ 数 字 ” 的 概率 为 p, 当 抛 了 10 次 时 ,出 
现 “ 数 字 ”6 次 . 问 至 少 还 需要 抛 多 少 次 才能 使 得 p 的 估计 的 精度 达到 0.01? 
令 =1 表 示 抛 第 i 次 硬币 时 出 现 的 是 “数字 ”,X; = 0 表示 抛 第 i 次 硬币 
时 出 现 的 是 “ 花 ”. 显然 PIX, =1} =p. 其 R 程序 为 
exam5.3=function(d) | 
X=rep(1,6) 
X[7:10] =0 
X[11:100] =sample(c(0,1),90,prob=c(0.4,0.6),replace= 
TRUE) 
k=100 
while( sqrt(mean(X) * (1-mean(X))/k)>d)| 
k=k+1l 
X[k]=sample(c(0,1),1,prob=c(0.4,0.6)) 
| 
list(N=k-1-10,X=X) 
| 
运行 程序 exam5.3(0.01) 得 到 至 少 还 需 抛 2371 次 才能 达到 精度 0.01. 


5.2 ”总体 均值 的 区 间 估 计 


假设 已 ,X,,… ,X, 是 来 自 于 一 个 总 体 均值 为 9 、 方 差 为 ao? 的 简单 随机 样 
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本 . 尽管 样本 均值 了 是 6 的 一 个 有 效 点 估计 ,但 我 们 不 能 认为 了 就 是 9. 通常 
合理 的 考虑 是 根据 站 构造 一 个 合适 的 区 间 来 覆盖 6. 


为 了 得 到 这 样 一 个 区 间 , 需 要 估计 量 了 的 ( 近似 ) 分 布 . 由 中 心 极限 定 
理 知 ,对 充分 大 的 n, 有 


Vi 2 NO), 


其 中 ~ N(0;1) 意 指 “ 近 似 服从 标准 正 态 分 布 ”. 另外 ,如 果 用 5 来 蔡 换 未 知 的 
标准 差 o, 那么 样本 均值 仍然 服从 渐 近 正 态 分 布 . 当 元 充分 大 时 ， 


Vis 2 N(0,1). (5.2.1) 


由 (5.2.1) 知 , 9 的 置信 度 为 1 - a 的 置信 区 间 为 元 4 
n 

现 考虑 在 一 个 模拟 过 程 中 ,要 产生 新 的 数据 , 问 什么 时 候 停止 产生 新 的 数 
据 ? 解决 此 问题 的 方法 是 首先 选择 a 和 1, 并 继续 产生 数据 直到 9 的 置信 度 
为 1 - a 的 置信 区 间 长 度 2 不 超过 上 其 算法 如 下 : 

Step 1: 至 少 产生 100 个 数据 . 

Step 2: 连 续 地 产生 数据 ,直到 产生 的 数据 的 个 数 正 使 得 2 < 其 中 
5 是 由 这 个 数 产生 的 样本 标准 差 

Step 3: 如 果 x 和 s 是 了 和 S$ 的 观察 值 , 则 9 的 置信 度 为 1 - a 的 区 间 估计 


为 元 十 za 


有 


le 


【 例 5.4】 在 用 平均 值 法 信 计 时 , 即 估计 积分 VT 二 dx, 构造 一 个 


长 度 小 于 0.01 的 区 间 使 此 区 间 以 95% 的 可 靠 性 包含 7, 问 至 少 需 要 模拟 多 
少 次 ? 
编写 程序 如 下 : 
exam5.4=function(alpha,1) | 

ssM=0;x=runif(100);k=100 # ssM 是 M 的 样本 方差 

M=sqrt(1-x’);Mbar=MI[1] 

for(iin 1:(k-1l))| 

Mbar[i+1] =Mbar[i] +(M[i+1] -Mbar[i] )/(i+1) 
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ssM[i+1] =(1-1/i) * ssM[i]+(i+1) * (Mbar[i+1l]-Mbar[ 订 7) 
repeat | 
k=k+l 
x[k]=runif(1) 
M[k]=sqrt(1-x[k]’) 
Mbar[k] =Mbar[ k-1]+(M[k]-Mbar[ k-1])/k 
ssM[k]=(1-1/(k-1)) * ssM[k-1]+k * (Mbar[k]-Mbar[ k=1])? 
if(8 * qnorm(1-alpha/2) * sqrt( ssM[ k])/sqri(k)<] ) break 
| 
list(low=4* (mean(M)- qnorm(1-alpha/2) * sqrt(ssM[k] )/sqrt(k) ) ， 
upp=4* (mean(M)+qnorm(1-alpha/2) * sqrt(ssM[ k |])/sqrt 
(k)),N=k,Pi=4 * mean( M)) 
} 


5.3 Bootstrap 方法 - 


假设 某 总 体 半 的 分 布 函数 F(x) 未 知 ,其 观察 值 是 X, = x, ,i= 1,2,…,n. 
一 般 通 过 经 验 分 布 函数 ,估计 分 布 函数 FF, 其 中 
Fs) = Ti < x,i = 1,2,…,n| ,# 表 示 对 i 的 计数 . 
注 :符号 “#” 在 公式 中 ,表示 计数 ,在 程序 中 ,表示 对 该 语句 的 注释 . 以 后 
不 再 装 述 . 
我 们 也 可 以 将 已 看 做 是 一 个 离散 随机 变量 X, 的 分 布 函 数 , 即 表 5-1. 











如 果 x; 有 相同 的 值 ,我 们 将 对 应 的 概率 合并 ,例如 , x， = 0,x, = x， =2, 那 么 
1 
3 


plX, = 0} = ,Pix =2| = 地 
假设 我 们 对 分 布 函 数 FF 的 参数 90(F) 感 兴趣 . 例如 , 6(F) 可 能 是 FF 的 均 
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值 ,或 者 中 位 数 ,或 者 任何 其 他 参数 . 又 假设 用 来 估计 9(F) 的 统计 量 g(X， 
X，，… ,了 ) 已 经 给 出 ,为 了 判断 g(X,,X,;…;X;) 的 精度 ,我 们 要 估计 其 均 方 
误差 . 即 

MSE(F) = E:[(g(X,X,,.…,X,) - 0(F))’] 


特别 , 当 6(F) = E[X] , 且 g(X,,X,，,…,X,) = 立时 立刻 得 到 MSE 的 一 个 估计 
量 为 二 而 一 般 情形 下 , 9( F) 为 X 的 中 位 数 时 ,其 均 方 误差 的 形式 不 明显 ， 


那么 我 们 用 Bootstrap 方法 对 此 均 方 误差 MSE 进行 估计 . 

我 们 知道 ,如 果 分 布 函数 是 已 知 的 ,在 理论 上 就 能 够 计算 出 9 的 估计 量 
的 均 方 误差 . 车 分 布 函 数 玉 未 知 ,由 Glivenko-Cantelli 定理 知 , 当 n 充分 大 时 ， 
Ff 以 概率 1 一 致 收敛 到 下 . 

又 若 9 是 分 布 函数 FF 的 一 个 连续 函数 , 则 

MSE(F,) = E, [(g(X,,X,,.,X.)a-00F:)) 53:1) 

近似 地 等 于 MSE(f). 在 (5.3.1) 中 X; 被 看 做 是 具有 分 布 函 数 .的 相互 独 
立 的 随机 变量 . MSE(F.) 被 称 为 MSE(F) 的 Bootstrap 估计 . 


当 用 样本 均值 来 估计 总 体 均值 时 ,其 均 方 误差 为 E[ ( 邓 - 0)*] = 呈 . 因为 
0 未知 ,我 们 很 自然 地 用 样本 方差 对 之 进行 估计 ,也 就 是 ,样本 均 方 误差 
MSE(P) 的 估计 为 三 

如 果 用 Bootstrap 法 ,我们 对 样本 均 方 误差 就 用 下 式 来 估计 

estc -让 ] 
其 中 无 ,入 ,…,X, 是 相互 独立 的 服从 分 布 F, 的 随机 变量 因为 
Br,[ 5 | =n Ll, 
又 因为 了 
Vars = BIG- ED = Eo L(x -5 = | (a) 


所 以 





V 下 2 Cx -x)? 
MSE(F.)= Varr| > .4 el ) 人 -az 
ee】 n 


由 此 知 , 当 用 样本 均值 估计 总 体 均 值 时 ,Bootstrap 法 是 没 必 要 的 . 但 为 了 看 出 
Bootstrap 方法 的 有 效 性 , 现 给 出 一 个 实例 进行 验证 :假设 有 100 个 数据 来 自 标 
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准 正 态 分 布 天 , 现 利用 这 些 数据 用 Bootstrap 法 估计 随机 变量 的 期 望 9 = EX. 
由 理论 分 析 知 , XX 是 9 的 估计 , 且 EX=0,X 的 标准 误差 为 sd(X) = 
二 1 
Var(X) = 一 一 = 0. 1. 及 些 
VVar( 有 而 首先 利用 R 生产 这 些 数据 
>gauss=rnorm(100) 
再 进行 Bootstrap 抽样 
>boot=0 
>for(i in 1:1500) | 
boot[i] =mean( sample( gauss ,replace =TRUE) ) 
| 
现在 计算 出 其 均值 和 标准 误差 ; 
>mean( boot) ;sd(boot) 
也 可 采取 直接 计算 方法 : 
>mean( gauss) ;sd( gauss ) /sqrt( 100 ) 
现 把 它们 的 结果 列 人 表 5-2. 


表 5-2 










0.975 分 位 数 


均值 的 估计 | 均值 的 标准 误差 


理论 值 0.196 
直接 法 0.150 
Bootstrap 法 


但 是 Bootstrap 法 不 是 为 了 提高 估计 量 的 精度 ,而 是 一 般 用 来 对 估计 量 的 


方差 进行 估计 . 若 我 们 所 感 兴趣 的 参数 (下 ) 是 分 布下 的 方差 , 则 其 估计 量 为 
O(F,) = Varr (X) = > a 


我 们 首先 考虑 
MSE(P, = EL (g(a srs Ky ~ a( EY). 
而 
XXX) -0(F )]’ 
MSE(F,)= 并 … 了 [g(x za， A 9(F.)] 
其 中 ,每 个 i 取 遍 1 到 n, 所 以 MSE(F.) 通常 要 求 计算 n" 个 和 式 , 当 于 很 大 
时 ,这 是 一 个 天 文 数字 . 
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0 


要 克服 上 述 问题 ,首先 产生 ”个 相互 独立 且 具 有 分 布 函数 ,的 随机 变量 
3 
A Oa. 
接着 产生 第 二 组 随机 变量 X? ,X,”,… ,X?, 并 计算 
se RO 
等 等 ,直到 收集 到 变量 7,Y,,… ,Ys， 因为 这 些 Y 是 相互 独立 的 ,有 均值 


MSE(F.) ,所 以 我 们 能 够 用 其 平均 值 了 也 作为 MSE( ,) 的 估计 量 . 


【 例 5.5】 如 果 已 知 某 随 机 变量 X 的 15 个 观测 值 如 下 : 
有 
试用 Bootstrap 法 估计 Var(X) 及 Var(S ) ,其 中 $ 为 样本 方差. 
我 们 用 如 下 R 程序 就 可 得 到 其 估计 : 
X 表示 已 知 观 测 样本 ,pr 为 X 对 应 的 经 验 概 率 分 布 ,fboot 是 统计 量 表达 
式 ,B 为 重复 抽样 次 数 . 
boot=function( X ,pr, fboot,B) | 
Tboot=0 
for(iin 1:B)!| 
Y=sample(X ,length(X) ,prob=pr,replace=TRUE) 
Tboot[i] =fboot(Y) 
| 
Tboot 
| 
=e(4 ,5,.6,.7,8,.9,10 ,1 ,13,15,16 ,17, 20, 21) 
WetT/13 1/IS, TIS T7119 1/1S 171S 171S, WIS T/TS 1719- 3/15, 
1/15 ,1/15 ,2/15) 
调用 程序 
>T=boot( X ,pr,var,100) 
>mean(T) 
>var( T) 
得 到 Var( 久 ) 及 Var(S?) 的 估计 值 分 别 为 32.925 和 53.957. 


练 习 5 
1. 连续 产生 指数 分 布 B(1) 的 值 直 到 个 为 止 ,其 中 宇 100 满足 放 < 
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0.01, 5 为 此 个 数据 的 样本 标准 差 . 问 : 
(1) n 至 少 为 多 少 ? 
(2) 样 本 均值 和 样本 方差 各 为 多 少 ? 它们 与 理论 值 有 何 差别 ? 


2. 根据 产生 的 随机 数 估计 | exp(**) dx. 要求 至 少 产生 100 个 随机 数 , 直 


到 估计 量 的 标准 差 小 于 0.01 为 止 . 
3. 证明: 如 果 我 们 增加 随机 数 直 到 其 和 超过 1, 则 期 望 增加 的 数 等 于 e. 也 
就 是 ,如 果 


N=min{n: FU > 上 | 
则 ELN] =e. 
(1) 用 上 述 方法 估计 。, 并 模拟 1000 次 . 
(2) 估 计 (1) 中 给 出 的 估计 量 的 方差 ,并 给 出 e 的 置信 系数 为 0.95 的 区 
间 估 计 . 
4. 考虑 一 个 随机 数 序列 并 令 M 表示 首次 小 于 前 面 的 数 的 下 标 . 也 就 是 


M = minln:Ui < UVU,<:… <U,., > LU 


(1) 论 证 PIM > ni = 二， 让 


(2) 用 等 式 E[M] = 可 PIM > 中 证明 E[M] = e; 


(3) 用 (2) 来 估计 e, 做 1000 次 模拟 ; 
(4) 估 计 (3) 中 的 估计 量 的 方差 ,并 给 出 e 的 置信 系数 为 0.95 的 区 间 估 
计 . 
5. 在 用 随机 投 点 法 估计 5 时 ,做 多 少 次 模拟 才能 获得 一 个 长 度 小 于 0.1 
的 区 间 ,使 之 以 95% 的 可 靠 性 包含 7? 
6. 为 了 估计 E[X] ,XX, ,X,,… ,Xe 已 经 被 模拟 出 ,其 数据 如 下 : 
10,11,10.5,11.5,14,8,13,6,15,10,11.5,10.5,12,8,16,5. 
再 根据 这 些 数据 ,如 果 我 们 要 使 五 [X] 的 估计 量 的 标准 差 小 于 0.1, 大 概 还 需 
要 运行 多 少 次 ? 
7. 为 了 估计 6, 产生 了 20 个 相互 独立 的 具有 均值 9 的 随机 数 , 其 值 如 下 : 
102, 112, 131, 107, 114, 95, 133, 145, 139, 117, 
93, 111, 124, 122, 136, 141, 119, 122, 151, 143. 
如 果 要 确定 9 的 置信 系数 为 0.99 长 度 为 1 的 9 的 最 终 估 计量 ,另外 还 需要 产 
生 多 少 个 随机 数 ? 
8. 令 XX ,X,,…,X, 是 相互 独立 同 分 布 的 随机 变量 ,有 未 知 均值 .对 给 定 
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的 常数 。< 5, 我们 对 估计 p= P|。 < 了 -< 引 感 兴趣 
(1) 解 释 如 何 用 Bootstrap 法 估计 p ; 


(2) 如 果 nn=10, 且 针 ,的 值 为 56,101,78,67,93,87,64,72,89,69,; 求 p 的 
估计 值 , 取 a =- 5,5 =5. 


n SA 
9. 如 果 n =3,X, 31 =3,X 22, 令 Sr= i ) 





六 -二 为 样本 方差， 
则 Var(S ) 的 Bootstrap 估计 是 什么 ? 

10. 如 果 从 某 分 布 中 抽取 出 的 样本 观测 值 如 下 :16,17,20,26 ,22 ,25 ,23， 
25,18,17,22,23,19,20,19,21,12,18,17,14, 共 有 20 个 数据 , 则 Var( S$’) 的 


Bootstrap 估计 是 什么 ? 
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在 前 面 介 绍 的 对 随机 变量 的 期 望 6 = EX 的 模拟 过 程 中 ,我们 是 连续 地 
产生 个 独立 同 分 布 的 随机 变量 X,X,，,… ,X,, 与 9 的 偏差 为 了 的 标准 误 


差 是 否 可 以 改进 模拟 方法 ,使 其 标准 误差 更 小 呢 ? 本 章 各 节 内 容 就 是 对 


这 个 问题 的 具体 回答 . 
6.1 对 偶 变量 法 


假设 我 们 对 估计 9 = EL[X] 感 兴趣 ,又 假设 产生 了 同 分 布 且 具 有 均值 9 的 
随机 变量 关 , 和 X,, 则 
| 十 大 
| 


Var( = 地 [Var(X) YY + IO AIT 


车 X, 和 是 负 相关 的 , 则 Var 汪汪 于 ) < 诗 [Var(X) + Var(X,)], 即 ,在 


某 种 意义 上 说 ,方差 减 小 了 ,也 就 是 ,估计 的 精度 得 到 提高 , 而 仍然 有 - 


X 
汪汪 全 = 9 下 面 的 定理 将 会 告诉 我 们 如 何 改进 模拟 方法 来 提高 估计 的 精 
度 . 
定理 6.1 如 果 X,,X,,…,X, 相互 独立 , 则 对 任何 元 增 丽 数 /和 g， 


ELf(X)g(X)] > E[f(X)]ELg(X)], (6.1.1) 
其 中 怀 = (XX,,X,,…,X,). 
证 ”用 归纳 法 证 明 . 当 ”=1 时 , 令 f 和 8 为 单 变量 增 函 数 . 则 对 任意 的 x 
和 7y, 因为 车 x > y(x < y) 则 这 两 个 因 式 都 是 非 负 的 ( 非 正 的 ) , 故 
[f(x) -7y)][g(x) - g(y)] =0. 
从 而 ,对 任意 的 随机 变量 X 和 YY， 
[f(X) -fA(Y)][lg(X) - g(Y)] =0, 
蕴涵 着 
146 





一 第 6 这 5 模 取 将 于 防 款 牙 林 一 


E[f(X) -A(Y)][g(X) -ge(Y)] >0. 
上 式 等 价 于 
EL[f(X)g(X)] + E[f/(Y)g(Y)] > ELf(X)g(Y)] + EL[f(Y)g(X)]. 
如 果 假 设 X 和 YY 是 独立 同 分 布 的 ,那么 在 此 情形 下 ,就 有 
E[f(X)g(X)] = EL[f(Y)g(Y)], 
E[f(X)g(Y)] =E[f(Y)g(X)] = E[f/(X)]E[g(X)], 
我 们 获得 了 n = 1 的 结果 : 
假设 (6.1.1) 对 n -1 时 成 立 , 现 在 假设 X,X,,…,X, 是 相互 独立 的 ,ff 和 
8 是 增 函 数 . 则 
E[AX)g(¥) [X=%, ]= E[fX ,Ks Ks sx, EK sas Hiss) | KY = %,] 
= E[f(X, ,X, ,EK ,XX %, ) ] (由 独立 性 ) 
>>E[AX , 庆 ，… ,1 ,x,) ]E[g(X ,名 ，…, 辽 x,) 氏 由 归纳 假设 ) 
= EL[AX) | X, = x%, JE[g(X) |X, = %,]. 
从 而 ， 
E[f(X)g(X) |X,] > E[f(X) |X,]Elge(X) |X,], 
对 上 式 两 边 取 期 望 得 到 
E[f(X)g(X)] > E[E[f/(X) |X,.]E[lge(X) |X,]] > EL[f(X)]E[g(X)]. 
上 述 最 后 一 个 不 等 式 成 立 是 因为 E[f(X) |X,] 和 E[g( 了 ) |X;] 都 是 XX 的 单 
调 增 函 数 ,因此 由 n = 1 的 结果 有 
EL E[f(X) | X,]ELg(X) |X,]]> EL[E[/(X) |X,]]E[LELg(X) |X,]] 
= E[f(X)]ELge(X)]. 
推论 6.1 如 果 h(x, ,x,,… ,x,) 是 其 每 个 自 变量 的 单调 函数 , 则 对 独立 
随机 数 的 集合 U,,U,,… ,U,, 有 
Cov[h(U ,Uy VU) hl -Ul -UVU,,…,1-U)]<0. 
证 不 失 一 般 性 ,假设 h 是 其 前 r 个 自 变 量 的 增 函 数 ,是 后 n 一 r 个 自 变 量 
的 减 函数 . 从 而 , 令 
Ra) = hy ,Ras Rs ho bs sl ~ X20 — %,), 
BXisX2s Xs ) =— hl -wl 
已 知 f 和 g 都 是 增 函 数 . 因此 ,根据 上 述 定理 
Cov[f(U,,U,,,U,),g(U,U,,…,U,)] =0, 
或 者 等 价 地 ， 
Cov[h(Ui ,Uy Ul -Ul -UV,), 
hlT= ,1 -Ul -UU U)) < 
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此 结果 成 立 是 因为 随机 向 量 h(U,U,,…,U,),h(1 -=U,l -UVU,,…,1 - U,) 

有 与 下 述 随 机 向 量 相同 的 联合 分 布 : 
及 GE 
h(1 人 于 UU UD. 

EE 

如 何 产 生 X, 和 X, 是 负 相 关 的 呢 ? 根 据 上 述 定 理 , 我 们 按 下 述 方法 来 进 

行 : 假 设 X, 是 m 个 随机 数 的 函数 , 即 假设 X= h(U,V,,…,U,), 其 中 Ui， 

U,,…,U 是 m 个 相互 独立 的 随机 数 . 令 随 机 变量 XY, =h(1 -Ui,1 - U,,…， 


1 - 以 ). 易 知 U 与 1-U 同 分 布 , 且 Cov(U,1 -VU)=- 方 . 如 果 h 是 每 个 坐标 


的 单调 函数 ,那么 X, 与 X, 是 同 分 布 且 负 相关 的 . 称 此 随机 变量 X, 为 X, 的 对 
偶 变 量 ( antithetic variable) . 据 此 ,我们 可 以 看 到 此 方法 有 两 大 好 处 :不 仅 使 
最 终 的 估计 量 有 更 小 的 方差 ,而 且 也 节省 了 产生 第 二 组 随机 数 的 时 间 . 


【 例 6.1】 假设 要 估计 0-=| ods=e -1, 如 果 是 独立 地 产生 2 个 随机 数 
U,,U,, 则 估计 的 方差 为 


中 以 
va 一 二 二 汗 入 ] = Var(e ') _ 0. 1210. 
2 2 


其 标准 差 为 V0. 1210 = 0. 34785. 

因为 函数 h(wu) =e" 在 (0,1) 上 显然 是 一 个 单调 递增 函数 ,用 对 偶 变 量 法 
产生 的 U 和 1 -UV 的 方差 为 

ev + el Var(l(e’) Cov(e',e'") 

ye Ee 


= 0. 0039 
及 » 


标准 差 为 V0.0039 = 0.06245. 精度 提高 了 82%. 
【 例 6.2】 令 X,i=1,2,…,5 是 均值 为 1 的 独立 的 指数 随机 变量 ,模拟 
估计 


5 


90=P{ ix, >21.6}. 
i 


如 果 直 接 产 生 2n 组 指数 随机 向 量 ( 和 RX ,… ,Xs) ,i= 1,2,…,2n, 邻 
, 人 > 21.6, 


0 ,否则 . 
时 2n a . 
通常 用 了 = > 元 对 9 进行 估计 ， 而 了 1 = 0, Var(1.)= 0(1 - 0), Var(1,)= 
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2 = 多 为 坟 的 方差 . 若 用 对 个 变量 法 对 6 进行 估计 ,我 们 按 如 下 方式 产生 


2n 组 随机 数 : 
UU ,Us,k = 1,2,..3275 其 由 心 a le U5 
令 计 " = 一 log Wi ). 


> Pm 三 21.6， 

”了 bo, 否则 

易 知 Ey 半 = 0, 我 们 仍然 用 下 = 位 于 对 6 进行 估计 . 容易 看 到 了 是 其 坐标 
£1{ 2n 名 2n 


的 单调 递增 函数 , L 的 方差 小 于 了 的 方差 . 我 们 用 下 述 程序 进行 验证 .第 一 个 
程序 为 直接 法 ,第 二 个 为 对 偶 变 量 法 . 
exam6.2_1=function(n)| 
X=matrix(0 ,nrow=n,ncol=5) 
k=0 
for(i in 1:n)| 
for(jin 1:5)!| 
U=runif(1) 
X[i,j]=-log(U) *j 
| 
if(sum( X[i,])>21.6) | 
k =k+1l 


| 
list(th=k/n,va=k/n* (1=k/n)/n) 
| 
exam6.2 _2=function(n) | 
X=matrix(0 ,nrow=2 * n,ncol=5) 
k=0;I=0;r=0 
q=seq(1,2*n,2) 
for(i in q) | 
for(j in 1:5)| 
U=runif(1) 
X[i,j]=-log(U) * j 
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X[i+l,j] =-log(1-U)*j 


| 
for(m in 1:(2*n))| 
if(sum(X[m, ])>21.6)1 
I[m]=1;k=k+1 
lelse ILm] =0 
for(i in q) | 
if(I[i] * I[i+1]==1)1 
r=rt+l1 
| 
| 
list(th=k/(2*n),va=k/(2*n) * (1-k/n)/(2*n)+r/(2*n’)) 
} 
运行 exam6.2_1(20000) 得 到 9 的 估计 为 0. 17265 , 方差 为 7.142099e- 
06 ;运行 exam6.2_2(10000) 得 到 9 的 估计 为 0. 17215 , 方差 为 5.838938e-06. 
如 果 运 用 正 态 随 机 变量 Y ~ N(j,o) 模拟 估计 EEh(Y,Y,,…,Y,)] (h 
是 其 坐标 的 单调 函数 ) 时 ,我 们 也 可 以 用 对 偶 变 量 法 减少 方差 . 
首先 产生 均值 为 见方 差 为 e” 的 正 态 随机 变量 Y, 然后 取 对 偶 变量 2p - 
Y, 易 知 24 -了 也 具有 均值 上 和 方差 o*. 显然 它 和 了 是 负 相关 的 . 


6.2 条 件 期 望 法 


假设 我 们 要 模拟 估计 随机 变量 X 的 期 望 9= EX. 如果 给 定 某 个 变量 了 且 
其 概率 分 布 已 知 , 当 给 定 了 时 , 式 在 给 定 了 时 的 条 件 分 布 可 以 确定 , 那 我 们 就 


先 从 Y 中 抽样 得 到 Y,,Y,,…,Y,, 然后 计算 出 E[X|Y = y,] 的 值 ,再 用 ,= 
工科 ELX|Y =y] 对 9 进行 估计 .由 1.2.1 节 知 ,X, 为 9 的 无 偏 信 计 , 且 其 方 
差 为 

Vat TVar( ELX | 7]) = TVar(X) 二 BE[Var( | 7)]. 


由 此 知 ,条 件 抽样 比 直接 独立 地 抽取 个 下 对 8 的 估计 要 精确 . 称 此 条 件 抽样 
方法 为 条 件 期 望 方差 缩减 法 ( conditional expectation ) . 
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【 例 6.3】 用 条 件 期 望 方差 缩减 法 模拟 估计 元 .在 例 3.3 中 我 们 采用 了 
在 一 个 以 原点 为 中 心 面积 为 4 的 正方 形 内 随机 地 选择 落 在 此 区 域 中 的 半径 为 
1 的 圆 盘 内 的 点 来 估计 T. 令 太 =20 -1, 其 中 UV,i= 1,2 是 随机 数 , 令 
癌 若 V +V <1, 
0， 否则 . 
在 例 3.3 中 知 E[ 了 1] 二 而 
E[I|IV =v]=PIV + <1|V,=v) 
=Plv +V, <1|V,=") 
=Ply <1-v| (根据 Vi 和 VV, 相互 独立 ) 
=Pl- Vi-v <Vs<vl-v| 


Ey 工 dz (因为 克服 从 ( - 1,1) 上 的 均匀 分 布 ) 
= 多 
=V1l-v. 
即 
E[T|W]) =Ml -VY, 
从 而 
Var(EL[IT| VI)= Var( /l= WH)= El -VV) = (ECA = )) 
=- 子 - (了 于 = 0.0498， 
易 知 


TT 
Var( 1) | < = 0. 1686 ， 

从 而 证 明了 条 件 期 望 方 差 缩 减法 使 独立 抽样 法 的 方差 减少 了 70.44% ,而 且 
还 可 看 到 对 每 次 模拟 仅仅 需要 一 个 随机 数 而 不 是 两 个 . 进一步 还 可 以 看 到 

E/l - v7)=| ML sw 本 dx =-[ vi -x dx=E(ViI-U) 
其 中 0 为 随机 数 . 因为 函数 V1 - w 显然 在 区 间 0 <w < 1 上 是 的 单调 下 降 
函数 ,所 以 可 用 对 偶 变 量 方法 对 上 述 模拟 再 作 进 一 步 改 进 . 

【 例 6.4】 在 保险 中 , 令 X, 表 示 第 i 个 客户 的 索赔 量 , N 表示 到 某 个 特定 
时 刻 上 保险 公司 被 索赔 的 次 数 . 令 $ = 2X 是 到 :时 保险 公司 付 给 的 整个 索 
赔 量 . 运 常 假定 X,,i=1,2,… 是 独立 同 分 布 的 .如 果 在 给 定 随机 变量 4=A 的 
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条 件 下 , N 的 条 件 分 布 是 具有 均值 的 Poisson 过 程 , 称 YY 是 一 个 合成 的 Pois- 
son 随机 变量 . 如 果 A 有 概率 密度 函数 g( 入 ) , 易 知 

PIN=n} =| a 


0 n 
4 的 分 布 函数 就 称 为 合成 分 布 函数 . 
为 了 保证 保险 公司 不 致 破产 ,要 对 下 面 的 破产 率 进行 估计 : 
p= | > X, > | 
其 中 e > 0 为 某 个 索赔 底 限 . 粗糙 的 模拟 方法 是 
Step 1: 产 生 WV 的 值 , 记 为 N=n. 
Step 2; 产 生 Xk ;六 用。 的 值 , 令 


， | 若 立 艺 六 C， 


e 





0， 否则 . 
Step 3: 产 生 若 干 1 的 值 ,然后 计算 其 平均 值 即 为 p 的 估计 量 . 


SM=min[n: DX > "路 注意 到 7 = 1eeN > M, 而 E[I|M=m]= 


PINzMIMNH=ml =PIN>m ,故我 们 可 通过 条 件 期 望 法 对 上 述 估 计量 进 
行 改进 ,其 算法 为 

Step 1: 产 生 X, 的 值 ,直到 产生 的 值 的 和 超过 常数 c 时 停止 . 

Step 2: 令 1 为 Step 1 中 了 ;的 个 数 . 

Step 3: 用 PIN > m| 作为 此 模拟 的 p 的 估计 量 . 

【 例 6.5】 ( 例 6.4 的 应 用 ) 假 设 在 一 周 内 ,一 个 保险 公司 的 意外 保险 索 
赔 次 数 依赖 于 环境 因素 U. 如 果 因 素 的 值 UV = 4, 那么 索赔 次 数 将 服从 均值 为 


a 的 Poisson 分 布 .假设 忌服 从 (0,1) 上 的 均匀 分 布 , 令 p 表示 在 一 周 时 


间 内 至 少 有 20 次 索赔 的 概率 . 用 条 件 期 望 法 产生 一 个 有 效 的 模拟 估计 量 . 
令 
a 站 若 N 宇 20， 
0， 否则 . 


0. 2897, 其 方差 Var(1) = p(1 -p) = 0.20578. 
计算 9 = PIN =n| 的 程序 为 
h=0 
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for(n in 1:19)1 
g=function(x)exp(—15/(0.5+x)) * (15/ (0.5+x))"/prod(1:n) 
h[ n+1] =integrate( g,0,1) $ value 


g0=function(x)exp(-15/(0.5+x)) 
h[1] =integrate(g0,0,1) $ value 
h[21]=1-sum(h[1:20]) 
得 到 PIN > 20| = 0.2897083. 
条 件 期 望 法 : 先 产 生 随 机 数 U, 在 U = 的 条 件 下 ,产生 一 个 Poisson 随机 
变量 ,对 此 进行 n 次 模拟 , 求 出 NN = 20 的 频率 .其 R 程序 为 
exam6.4=function(n) | 
k=0;N=0 
for(i in 1:n)1 
u=runif(1) 
N[i] =mpois(1,15/(0.5+u)) 
if( N[i] >=20)1 
k=k+l 
| 
| 
k/n 
| 


我 们 运行 exam6. 4(20000) ,得 到 p 的 估计 值 为 0. 28525 ,标准 误差 为 
0. 00319. 


6.3 分 层 抽样 法 


假设 某 随机 变量 S$ 依赖 于 随机 变量 了 ,X 以 一 定 的 概率 p;,i=1,2,…,l 取 
值 x, ,x,,… ,x,. 如 果 我 们 要 估计 随机 变量 5 的 均值 9=ES, 直接 的 方法 是 从 5 


中 抽取 ”个 简单 随机 样本 5, ,S,,… ,5,, 用 样本 平均 值 S 来 估计 9, 其 估计 的 
标准 误差 为 nD. 
因为 ES = 2 ELSIX =xlPIX = zx} = 2 ELSIX = x;]pi, 我 们 可 以 从 
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i 
SIX =%oi ,2 中 抽取 样本 5;,j = 1,2,…,k,， 令 S,* => 全 以 及 
1 


5 = 了 PS ,n= 了 ,用 5” 作为 9 的 合计 ,此 估计 也 是 9 的 无 偏 估计 , 且 其 
标准 误差 





比 上 述 直 接 的 方法 的 要 小 . 此 方法 称 为 分 层 抽样 法 ( stratified sampling). 
现在 的 问题 是 给 定 总 样本 数 n, 每 层 抽 多 少 能 够 使 估计 的 标准 差 最 小 . 记 
‘ pVar(S|X=x,) 


0 Ba Ds) 


由 微 积 分 知识 ,我 们 解 如 下 方程 : 
90 _ es 
和 = 
30 _ 
oA 


就 可 确定 ,i = 1,2,… ,li 的 值 . 

【 例 6.6】 ( 续 例 6.1) 我 们 将 抽样 区 间 [0,1] 划分 为 两 个 小 区 间 : [0， 
0.5) ,[0.5,1]. 假设 以 概率 0.5 选择 从 U(0,0.5) 中 抽取 个 独立 的 随机 变 
量 ,j=1,2,… ,hk ,以 概率 0.5 选择 从 U(0.5,1) 中 抽取 ,个 独立 的 随机 
变量 0V,,, j= 1,2,…,k,. 如 果 要 求 和 例 6.1 从 区 间 [0,1] 中 抽取 的 随机 数 的 
个 数 n 相同 ,那么 如 何 用 分 层 抽样 法 对 例 6. 1 中 的 9 进行 模拟 ? 

易 知 


0.5 
Ee""=| 2e’dx =2(Ve - 1)， 
0 
1 
Ee”™"= | 2e’dx =2(e -Ve), 
0.5 
0.5 
Var(Ui)=|[ esdr 4/e 1) 051 -40 1) 0. 05492, 
1 
Var( U, ,)= | Ze ds - 4(e ~ Ve)’ = 0.09493， 


如 如 
、 , 名 1 We 5 1 "a 
记 o, = VVar( Ui) i123 -Pi 人 于 和 的 页 2 , 则 


0.5* 0.5 co 
k, Ek; 





Var(5) = 
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对 上 式 求 导 , 知 a = = 0.37753 时 , Var( 8) 达到 最 小 , 目 为 e125 


与 例 6.1 的 结果 比较 得 
0.0078 _ 0.06125 _ 0.242 


n n n 

由 此 表明 对 偶 变量 法 优 于 分 层 抽样 法 ,分 层 抽样 法 优 于 独立 抽样 法 . 

【 例 6.7】 在 电脑 游戏 机 中 ,一 
家 将 1 美元 插入 机 器 中 ,然后 机 器 随机 地 
发 给 该 玩家 5 张 牌 . 允许 玩家 将 其 中 的 几 
张 牌 与 余下 的 47 张 牌 更 换 一 次 .玩家 获得 
的 盈利 依赖 于 其 最 后 的 牌 型 .下 面 是 一 个 
典型 的 盈利 表 . 

表 中 不 同 牌 型 互 不 相 容 . 

考虑 某 种 策略 ,例如 ,如 果 最 初 的 牌 是 
“ 顺 子 ”或 更 好 的 牌 就 不 再 换 牌 ;如 果 低 于 
此 牌 型 ,通常 保留 手中 的 对 子 或 三 条 .在 此 
策略 下 , 令 式 表示 玩家 在 某 一 手中 的 盈 
利 , 且 假设 我 们 对 估计 6 = E[X] 感 兴趣 ， 
让 我 们 以 最 初 发 给 玩家 的 牌 型 为 条 件 开始 
估计 ,而 不 是 直接 用 X 作 为 一 个 估计 量 . 令 R 代 表 “ 同 花 大 顺 ”,S 代表 “ 同 花 
顺 ”, 4 代表 “四 条 ”,“full" 表 示 “ 萌 芦 ”,flush 表示 “ 同 花 ”,staight 表示 “ 顺 ”, 3 
代表 “三 条 ”, 2 代表 “两 对 ”, 1 代表 “J 以 上 的 一 对 ”, 0 代表 “一 小 对 ”,“ oth 
er” 表 示 “ 其 他 ”的 牌 .我 们 有 
E[X] = E[X | RIPIR} + EL[X| SIP{S} + E[X|4]P{4} + E[X|full]Plfull} 

+ E[X|flush]Plflush} + E[X | straight]jP|straight} + E[X|3]P|3} 
+ E[X|2]P|2} + E[X|1]PI1} + E[X|O]P{0} + E[X |other]P{other}. 


再 令 C -(,) ,我 们 有 


PIR} =4C =1.539 x 10™, 
PS =4.9.C=1.3851 x .10™, 
Pl4} =13 .48 .C=2.40096 x 10™, 





3 72 

Pl 和 Hj = 稳 。 12| | | ) C = 1.440576 x 107’, 
4 \4 

13 , 

Pliosh) =4(( ,| -10] C = 1.965402 x 10-3 ， 
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Plstraight} = 10(47 - 4)C = 3.924647 x 10- ， 


12 
Pl3} = 13| ) C=2.1128451 x 107, 
2 
这 yi 训 
P|2| =| ) 所 ) | ] 5 = 4.7539016 x 10™, 
2) \2)\2 
4、/12 
P|1} =4 ) | )*c=°. 130021239 ， 
2 人 3 


Pl0} = 人] (2) 43C = 0. 292547788 ， 
oh Vg 
Plother} = 1 - PIR} -PS - Pifull} - Plflush} - Plstraight} - 
> Pl = 0. 5010527. 
因此 得 出 
E[X] = 0.0512903 + 》 EL[LX|i]Pli} + ELX |other] . 0.5010527. 


注意 到 2 张 新 牌 来 自 余 下 的 47 张 牌 ,这 47 张 牌 包含 了 与 手中 的 3 张 相同 的 
牌 中 的 一 张 ,两 类 牌 型 中 的 3 张 以 及 其 他 的 10 种 牌 型 中 的 4 张 ,那么 
E[X|3] 能 够 通过 分 析 得 到 . 令 下 是 最 后 一 手 牌 ,我 们 有 


PlF=4| 发 3 张 牌 } = -5 = 0.042553191， 
PIF=full| 发 3 张 牌 } = = 0.061054579， 
2 


PIF=3| 发 3 张 牌 | = 1 -0.061054579 - 0.042553191 = 0. 89639223. 

因此 ， 

E[X|3]=25(0.042553191) + 8(0. 061054579) + 3(0. 89639223) 

= 4. 241443097. 

类 似 地 ,我 们 可 以 分 析 得 到 E[X| 门 ,i=0,1,2( 推 导 留 做 练习 ). 

在 进行 模拟 时 ,我们 将 产生 一 手 牌 . 如 果 包 含 至 少 一 对 或 者 更 好 的 牌 , 则 
应 放弃 ,模拟 过 程 重 新 开始 . 当 我 们 得 到 一 手 牌 不 包含 一 对 或 者 更 好 的 牌 , 我 
们 应 当 采 取 任 何 策 略 去 放弃 和 接受 新 牌 . 若 X& 是 此 手 牌 的 盈利 , 则 X。 是 
E[XX| other] 的 估计 量 , 且 依赖 于 这 次 模拟 的 9 = E[X] 的 估计 是 

9=0. 0512903 + 0. 02112845(4. 241443097) + 0.047539016E[X|2] + 
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0. 130021239E[X |1] + 0.292547788E[X|0] + 0.5010527X.. 
估计 量 的 方差 为 
Var( 8) = (0. 5010527)’Var( X,). 

注 :(1) 我 们 曾经 假定 采取 的 策略 无 论 是 否 有 对 子 总 是 坚持 不 换 牌 . 然 
而 ,对 于 盈利 来 说 这 不 是 一 个 最 优 的 策略 : 例如 ,如 果 一 个 人 所 发 的 牌 为 2， 
10,J,Q,K, 都 是 黑 桃 , 较 好 的 就 是 放弃 2 再 抽取 另外 一 张 牌 ,而 不 再 坚持 同色 
(为 什么 ). 如 果 发 的 牌 是 10,J,Q,K, 都 是 黑 桃 ,另外 一 张 是 红心 10 ,更 好 的 策 
略 是 扔 掉 红 心 10 ,再 抽 一 张 牌 比 保持 一 对 10 的 策略 要 好 . 

(2) 我 们 通过 拆散 “other” 类 型 的 牌 ,“other” 类 型 的 牌 包含 了 同色 的 4 张 
有 牌 ,以 及 不 是 这 种 类 型 的 牌 来 进一步 利用 分 层 抽 样 法 . 没有 对 子 但 是 有 4 张 同 
色 的 牌 的 一 手 牌 的 概率 是 能 够 通过 分 析 计 算得 到 的 ,然后 利用 模拟 来 估计 在 
这 两 种 “other” 情 形 下 盈利 的 条 件 期 望 . 


6.4 重要 抽样 法 


令 针 = (X,,X,，,…,X,) 表示 具有 联合 密度 函数 (或 联合 概率 函数 ) /(x) = 
fwi,%，…,x,) 的 随机 向 量 ,又 假设 我 们 对 估计 
9=B[A(E)] = [h(x)f(x)de 

感 兴趣 ,上 式 是 一 个 对 所 有 的 x 取 值 的 n 重 积分 (如 果 X 是 离散 的 ,那么 积分 
就 意味 着 n 重 求 和 ). 

如 果 模拟 具有 密度 函数 为 /(x) 的 随机 向 量 是 困难 的 ,或 者 城下) 的 方差 
很 大 ,那么 就 不 能 直接 用 产生 n 组 随机 向 量 %, 来 估计 9. 对 此 问题 ,我们 将 用 
下 面 的 方法 解决 . 

如 果 g(x) 是 另 一 个 概率 密度 , 且 当 g(x) =0 时 , 著 =0, 那么 能 够 表达 0 
为 


pr pd (x)dr=E 从 全 全， (6.4.1) 


式 中 E, 指 生 2 外 关于 联合 密度 g(z) 求 期 望 
由 方程 (6.4. 1) 知 ,通过 连续 地 产生 具有 密度 函数 g(x) 的 随机 向 量 X 的 


"组 值 X, 然后 用 = 一 了 作为 信 计 量 来 估计 9. 如 果 密度 本 数 
g(x) 能 够 被 选择 使 得 随机 变量 有 一 个 小 的 方差 ,那么 此 方法 称 为 
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重要 抽样 法 (importance sampling) , 它 能 够 产生 出 9 的 一 个 有 效 估计 . 
现在 问题 是 如 何 选择 g(x) 全 大 重要 滑 各 区 的 下 于 天 小 考虑 


Var(6) = 一 Af en = 


从 理论 上 看 ,车 (X) >0 取 g(X) = 和 2A ， 则 Var(6)=0. 因为 0 是 未 知 


的 ,这 个 结果 是 无 用 的 . 但 它 也 给 我 们 一 个 启示 ,应 该 选取 与 几 X) 形状 接近 
的 g( 针 ) 可 以 减 小 方差 . 这 就 是 重要 抽样 法 的 基本 思想 . 


令 M(CD) = 如 [Le] = ef(x) ds 为 密度 函数 /的 矩 母 函 数 . 我 们 称 密度 函 
数 /(z) = 所 人 和) 为 /的 起 密度 函数 

设 随机 变量 X 的 分 布 函 数 为 F(x) , 随机 变量 了 的 分 布 函数 为 C(y) , 若 
对 任意 的 实数 *, 有 F(x) < C(x) , 则 称 随机 变量 X 随机 的 不 小 于 Y, 记 为 
X > 工 易 知 , 当 + > 0 时 ,具有 密度 函数 庆 的 随机 变量 比 具有 密度 大 的 随机 变 
量 大 ,而 当 ! < 0 时 , 则 相反 。 

例如 , X 服从 标准 正 态 分 布 N(0;1), 可 以 得 到 其 起 密度 /(z) = 


es” 令 了 的 密度 函数 为 上 (y) , 我 们 容易 验证 , 当 ; > 0 时 ,对 任意 的 实 





1 
V2T 
数 *, 有 1-P(z)=| 








二 < | 启 "* es 
从 此 例 也 可 看 出 ,在 某 些 情形 下 , 旋 密 度 f 和 具有 相同 的 表达 形式 .所 以 我 
们 根据 矩 母 函 数 构造 g(x). 
一 般 来 说 ,对 于 一 个 小 概率 事件 ,在 计算 机 上 是 很 难 直 接 模拟 的 ,我 们 用 
重要 抽样 法 先 模拟 一 个 较 大 概率 的 事件 ,再 转化 为 所 要 模拟 的 小 概率 事件 . 
【 例 6.8】 假设 X,,i = 1,2,…,20, 相互 独立 ,其 概率 函数 为 p(x) = 


p* (1 -和 ,其 中 zx=0 或 1,p=0.4 令 S= 了 x， 试 估计 9=P|S > 16|. 


令 
11s > 16| i 
0 pb 
以 及 p(x) 的 起 密度 函数 为 p,(x) = 1 则 6 =E,[IlS > 16}] = 


0.4”0.6" 


5, [1s > 16| 和 


-| . 我 们 得 到 9 的 重要 抽样 估计 量 为 
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20 万. 
$=11s > 161]] Fi 


~ 16 
易 知 和 <<e(0.6 + 0.40)"0.6"(3) ， 令 h(i) = ee(0.6 +0.40)". 当 


t > 0 时 ,我 们 得 到 使 h(1) 取 最 小 值 的 : ”= log 6. 则 9 的 重要 抽样 估计 量 为 


=1|S > 16}e™ (0.6 + 0.4e20. 450. 62 


6=11s >161(2) 3" (6.4.2) 
6 
易 知 

6 < ( 司 33 - 关 = 0. 001236. 


因为 6 很 小 ,直接 由 二 项 分 布 B(20 ,0.4) 很 难产 生 事 件 15 > 16|, 所 以 我 们 
注意 到 怒 密 度 


AB 6dr 06 0646 FI 


而 f..(1) =0.8 且 B(20,0:8) 的 均值 为 16 ,由 此 知 从 这 个 二 项 分 布 中 很 容易 
产生 事件 1$ > 161, 然后 将 这 里 的 S 代入 (6.4.2) 中 就 达到 了 目的 . 
其 R 程序 为 
exam6.7=function(n) | 
th0 = function(S) | 32 /6s | 
th=0 
for(i in 1:n)| 
RB =rbinom(1,20,;0.8) 
if(RB>=16) th[i] =th0(RB) else th[i]=0 
| 
list( mean =mean(th) ,var=var( th)) 
| 
运行 exam6.7(10000) 得 到 8 = 0. 0003229011, 其 方差 为 2.455389e-07. 
【 例 6.9】 令 瑟 = (Xi,X,,…,Xioo) 是 (1,2,…,100) 的 一 个 随机 置换 


(排列 ). 记 6 = ?| ix > 290000 上 试 估计 0. 

首先 来 判断 9 是 否 很 小 . 如 果 不 太 小 ,我 们 可 以 直接 模拟 出 次 排列 ,将 
满足 条 件 Dx, > 290 的 排列 的 个 数 m 除 n 就 得 到 9 的 估计 . 如 果 6 是 很 小 ， 
这 样 进行 的 模拟 不 太 稳定 ,估计 的 效果 不 好 . 因此 ,我 们 首先 计算 D2 的 均 
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值 和 标准 差 . 事实 上 ,容易 看 到 
1 101 
EX;, = 1 x1100+” + 100 x100 = 
A 
EX =1 0 + 100 0G 7 


Var[X,] = EX - (EX,)’ = 


1 , _ 101 x 151 
ELXX,] -0x 6  ， 
101 


Cov(X,,X) = E[XX,] - (EX,)” =- Ty 


则 
z[ Fm |: Bien -时 yj = 255025， 


va 7) -TVar[%] +2 > Cov(jX,, kX,) 
j=1 j=1 1sjsKke100 
8 OY 2 x 1107 站 2 


=70131875 


100 
sp| by 瑟 ] = V70131875 = 8374. 478. 
和 1 


从 而 ,如 果 假 设 > 充 ; 近似 地 服从 正 态 分 布 , 用 Z 表示 标准 的 正 态 随机 变量 ， 
那么 我 们 有 


ba P{z > 290000 - 255025 


8374. 478 
显然 9 是 一 个 小 概率 ,因此 我 们 用 重要 抽样 法 模拟 估计 6. 


为 了 利用 重要 抽样 法 ,我 们 需要 产生 一 个 置换 也 使 得 D4 > 290000 有 


}=P!2 > 4.1764} = 0. 00001481. 


一 个 较 大 的 概率 出 现 . 事实 上 , 当 j 大 、X, 也 较 大 时 ,也 访 , 就 大 ;反之 ， 袜 所 
就 较 小 . 产生 上 述 符合 事实 的 下 的 一 个 方法 是 

Stepl :首先 产生 独立 的 具有 均值 A, 的 指数 随机 变量 Y,, j = 1,2,… ,100 
其 中 和 > 0, j= 1,2,…,100 为 单调 上 升序 列 . 

Step2: 对 于 j= 1,2,…,100, 令 是 第 /个 最 大 值 的 指标 . 即 , Zn > fo > … > 
Yr 
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因为 对 于 大 的 7, 7 将 趋 于 了 中 一 个 较 小 的 值 ,从 而 得 到 当 7 大 时 , X 趋 于 
取 大 的 值 ,因此 2 jx, 比 当天 为 均匀 分 布置 换 时 趋 于 更 大 . 


现在 ,我 们 来 计算 EB| 末 罗 |. 令 RU) 表示 了 wj = 1,2,…,100, 的 秩 ,这 
里 秩 1 表示 最 大 的 , 秩 2 表示 第 2 大 的 ,等 等 , 秩 100 表示 最 小 的 . 注意 到 因为 
是 Y 中 的 第 j 个 最 大 的 , 则 有 R(X) = 六 从 而 
其 中 最 后 一 个 等 式 成 立 是 因为 XI ys 是 1 ,2,… ,100 的 一 个 置换 . 因 
此 ,我 们 看 到 

E| Bi%| = istRO)]. 
为 了 计算 ELR(O)], 令 
1 
1 =1 和 
0 ,否则 ; 
并 注意 到 
RCO)=1+ 1(i)). 
上 述 方程 表明 Y 的 秩 是 1 加 上 使 了 > Y 的 Y 的 个 数 . 因此 ,对 之 取 期 望 并 用 
到 下 述 事实 : 





PlY, < 了 | = 
Ai 十 Ai 
我 们 得 到 
A， 
E[R]=1+ 广 袜 a 
由 此 有 





100 100 A, 
Ab = Bil 证 3 3 : 
如 果 令 和 =j*" ,j=1,2,…,100, 那么 由 计算 得 到 | 5 | = 290293. 6. 所 
以 当天 是 由 这 些 参 数 生 成 时 ,将 有 


100 


P| 了 290,000 | ~ 0.5. 
j=1 


这 是 一 个 较 大 的 概率 . 从 而 ,我们 假设 模拟 估计 量 首先 通过 产生 独立 的 速率 分 
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别 为 产 " 的 指数 随机 变量 也 ,然后 令 万 为 第 7 大 的 指标 ,) = 二 2,…，,100， 而 得 
到 . 令 

2 > 290000， 

rk” 
那么 结果 是 天 为 Zr 是 最 小 的 Y, Yr。 是 第 2 小 的 …… 一 个 排列 . 当头 等 可 能 
地 为 排列 中 的 一 个 时 ,那么 此 结果 的 概率 为 0 当 模拟 按 这 样 进行 时 ,其 概 


率 为 

(SS CE)? 二 Ch ©.4 Di 

信 ( 硬 ) (EY a 
因此 ,由 1 次 模拟 得 到 的 重要 抽样 估计 量 为 
H(z") T(E") 


(100)! (下 上 ) 


0 = 





模拟 算法 为 
Step 1: 计 算 C = 1.7 > log(n) 和 a(j)=-j” ,j= 1,2,…,100, 的 值 . 
Step 2: 分 别 对 j= 1,2,…,100, 产生 随机 数 VU, 令 Y = a(j)log(U). 


Step 3: 产 生 久 ,j=1,2,…,100, 其 中 X 是 使 得 了 为 ,j=1,2,…,100， 
中 的 第 j 大 的 数 . 
100 
Step 4: 如 果 了 XX < 290000, 则 令 9 = 0 并 停止 . 
Step 5 :否则 , 置 $=P=0, 对 n 从 1 到 100, 令 S=5S+(X,)"” ,P=Pt+ 
log(S) ; 令 0=er. 
重复 运行 Step 2 至 Step 5r 次 ,计算 9 的 平均 值 。 
其 R 程序 为 
C=1.7*sum(log(1:100) ) ;theta=0 
for(r in 1:50000) | 
Y=0;U=0 
for(j in 1:100) | 
U[j] =ranif(1) 
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Y[j] =-j(-0.7) * log(U[j]) 
| 
X=0 
for(i in 1:100) | 
X[i] =order(Y)[100-i+1] 
| 
m=1:100 
if(sum(m * X)<=290000) theta[r] =0 
else | 
S=0;P=0 
for(n in 1:100) | 
S=S+X[n]“(0.7) 
P=P+log( S$) 
| 
theta[r] =exp(P-C) 
| 
| 


50000 次 模拟 的 样本 产生 的 估计 量 9 = 4.580375 x 10, 其 样本 方差 为 
2.956643 x 10“. 因为 对 粗略 模拟 估计 量 7 的 方差 为 Var(1) = 6(1 - 9) = 
3.77 x 10 怀 , 我们 看 到 


VarlD 127.5. 
Var( 9) 
练 习 6 


1. 试 利用 对 偶 变量 法 对 0 = | 进行 估计 ,并 与 独立 抽样 方法 得 到 的 
方差 进行 比较 。 
2. 如 何 通过 对 偶 变量 法 得 到 9 = | f eraxdy 的 一 个 模拟 估计 量 ? 利 


用 对 偶 变 量 法 是 否 比 独 立地 产生 随机 数 更 有 效 ? 并 给 出 其 估计 . 
3. (1) 若 2 是 一 个 标准 正 态 随机 变量 ,利用 对 偶 变量 法 设计 一 个 算法 估 
计 9=E[Z ie”], 并 编写 程序 . 
(2) 利 用 上 述 方法 做 模拟 得 到 区 间 长 度 不 会 超过 0.1 的 置信 区 间 , 你 能 
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确信 此 区 间 以 95% 的 置信 度 包含 6 的 值 吗 ? 


4. 设 XX 是 一 个 具有 均值 1 的 指数 随机 变量 . 

(1) 给 出 一 个 与 X 负 相关 且 也 是 均值 为 1 的 指数 随机 变量 ; 

(2) 用 对 侦 变量 法 估计 9 = | ?ed ; 

(3) 用 重要 抽样 法 估计 (2) 中 的 积分 ; 

(4) 比 较 上 述 (2) ,(3) 的 效率 . 

5. 令 区 和 了 是 相互 独立 的 其 分 布 函数 分 别 为 己 和 G, 其 均值 分 别 为 和 


Ar 的 随机 变量 . 对 一 给 定 的 值 i, 我 们 感 兴趣 的 是 估计 6 = PIX+Y<. 


(1) 给 出 一 个 粗 粹 模拟 方法 估计 9 ; 
(2) 用 条 件 期 望 法 获得 一 个 改进 的 估计 量 . 
6. 假设 Y 是 一 个 均值 为 1、 方 差 为 1 的 正 态 随机 变量 ,又 假设 在 Y=y 的 条 


件 下 ,是 一 个 均值 为 y 、 方 差 为 4 的 正 态 随机 变量 . 我们 用 模拟 来 有 效 地 估 


计 6 


=PIX > 1}. 

(1) 解 释 此 粗糙 的 模拟 估计 量 ; 

(2) 说 明 这 个 条 件 期 望 如 何 被 用 来 获得 一 个 改进 的 估计 量 ; 

(3) 说 明 (2) 中 的 估计 量 如 何 通过 利用 对 偶 变 量 法 进一步 地 改进 . 

写 一 个 模拟 程序 并 用 它 来 找 出 估计 量 的 方差 : 

(4) 粗 糙 模 拟 估 计量 ; 

(5) 条 件 期 望 估计 量 ; 

(6) 用 条 件 期 望 和 对 偶 变 量 法 的 复合 估计 量 ; 

(7) 9 的 精确 值 是 多 少 ? . 

7. 令 X 和 Y 是 相互 独立 的 指数 随机 变量 , X 具 有 均值 1,Y 具 有 均值 2. 试 


用 条 件 期 望 法 模拟 估计 PIX +Y > 4}. 


1 2 
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8. 令 XX 和 了 是 独立 的 5(n,p) 随机 变量 , 令 9 = E[e”]. 
(1) 给 出 模拟 9 的 粗糙 估计 量 ; 

(2) 用 对 偶 变 量 法 进行 改进 ; 

(3) 用 条 件 期 望 法 改进 粗糙 估计 量 . 


9. 考虑 一 个 有 20 个 独立 部 件 的 系统 ,其 中 部 件 是 以 概率 0.5 + 二 ,i = 


50 
…,20 ,失效 . 令 区 表示 失效 的 部 件数 . 
(1) 用 模拟 来 有 效 估计 PIX < 5} ; 
(2) 估 计 P{IX=5|X<51. 


10. 试 利用 分 层 抽样 法 估计 9 = E(W, + 玉 ,)7, 其 中 WW, ,W, 是 独立 同 分 布 
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的 Weibull( 威 布尔 ) 分 布 ,其 密度 函数 为 
Fons= Dtexp( 一 | 人 
11. 假设 随机 变量 X ~ N(2,4), 给 出 估计 BX 的 方法 并 用 对 偶 变 量 法 进 


行 改进 ,编写 程序 进行 计算 并 与 其 精确 值 进行 比较 . 
12. 考虑 积分 
0 = ed 
(1) 给 出 估计 6 的 几 种 有 效 方法 . 
(2) 编写 相关 的 程序 估计 0, 比较 这 几 种 方法 的 效率 . 
13. 在 例 6.6 中 ,推导 并 计算 E[x |i] ,i = 0,1,2. 
14. 假设 随机 变量 Xi,i S12 服从 正 态 分 布 N(u,0°). 
(1) 证 :其 诱 密 度 也 是 正 态 分 布 NA + o to ). 


(2) 利用 重要 抽样 法 给 出 0 = | 于 。" > a| 的 信 计 量 
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在 本 章 中 我 们 考虑 一 些 用 于 统计 模型 识别 中 的 模拟 程序 ,分 别 考虑 单 样 
本 、 两 样本 的 检验 及 非 齐 次 Poisson 过 程 假设 模型 的 模拟 验证 。 


7.1 单 样本 的 拟 合 优 度 检验 


人 们 对 所 遇见 的 现象 进行 分 析 时 经 常会 提出 一 些 假设 ,这 个 假设 就 是 某 
个 特定 的 概率 分 布 . 然后 根据 观测 数据 对 这 个 假设 作 统计 上 的 检验 ,也 就 是 判 
断 这 个 特定 的 概率 分 布 假设 与 观测 数据 是 否 一 致 . 这 种 检验 称 为 拟 合 优 度 检 
验 . 

进行 拟 合 优 度 检验 的 一 种 方法 是 , 先 划分 随机 量 的 可 能 值 为 有 限 个 数 的 
区 域 . 对 指定 的 概率 分 布 , 当 所 假定 的 分 布 所 有 的 参数 被 指定 时 ,可 以 计算 出 
随机 量 在 这 些 区 域 上 取 值 的 概率 . (我 们 将 观测 到 的 样本 数 n 按 每 个 区 域 上 的 
概率 进行 分 配 , 称 为 理论 上 的 个 数 ). 然 后 将 之 与 样本 值 落 在 每 个 区 域 的 个 数 
进行 比较 . 

在 下 一 节 中 , 当 某 一 个 参数 没有 被 指定 时 ,我 们 也 考虑 这 样 的 检验 . 首先 
考虑 一 个 离散 的 假设 分 布 情形 ,其 次 考虑 连续 的 假设 分 布 情形 . 

1. 离散 数据 的 拟 合 优 度 的 Xx? 检验 

假设 随机 变量 了 以 概率 |p.,i = 1,2,…,k| 取 值 1,2,…,k, 但 p; 未 知 .从 
Y 中 得 到 个 独立 的 观测 值 7,,Y,,… ,Y,. 我 们 要 对 假设 : {pi,i = 1,2,…,k| 
进行 检验 . 将 被 检验 的 假设 记 为 有 1,, 称 为 零 假设 , 即 

Ho:PIY=i} =p,, i=1,2,.…,k. 
要 检验 上 述 假设 , 令 N,,i= 1,2,…,k, 表示 这 些 7 等 于 i 的 个 数 .如 果 本 为 真 
时 , 则 N, 服从 参数 nn 和 p; 的 二 项 分 布 , 且 有 E[N,] = mp, 而 (N, - mg) 表明 
pi 与 PIY=i| 接近 的 程度 . 当 (N, - np;)* 相对 于 np; 来 说 大 时 ,表明 H, 不 正 
确 . 从 而 ,考虑 统计 量 
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Ni 一 已 
rm pi) 


当 @ 的 值 小 时 ,表明 有 H, 是 真 的 ,反之 有 H， re 根据 实际 数据 计算 出 检验 统计 
量 @ 的 值 为 上 当 H, 为 真 时 ,其 p 值 为 
P 值 =Ps10 = 
车 p 值 小 于 某 个 给 定 的 检验 水 平 a (通常 为 0.05 或 者 是 更 保守 的 取 0.01) 出 
现时 ,表明 8 超出 了 我 们 能 够 容忍 出 现 误 差 的 程度 ,所 以 有 理由 拒绝 零 假设 ， 
因此 说 明 数 据 和 模型 不 一 致 ;否则 ,就 接受 零 假设 ,说 明 数 据 和 模型 是 一 致 的 . 
在 观测 到 检验 统计 量 0 的 值 :后 , 剩 下 来 就 是 确定 概率 p 值 = Py10 > 
计 . 当 有 为 真 时 ,对 充分 大 的 n, 0 近似 服从 自由 度 为 -1 的 Xx? 分 布 .从 而 
pP 值 = 已 | 到 三 寺 ， Cy 
其 中 Xi, 是 一 个 具有 自由 度 k -1 的 x 随机 变量 . 称 此 检验 法 为 Pearson 拟 合 
优 度 xx 检验 法 ,或 简称 为 拟 合 优 度 x? 检验 法 . 若 利用 Pearson 拟 合 优 度 x 检验 
法 得 到 的 p 值 接近 于 检验 水 平 a, 这 样 就 很 难 判 断 是 接受 还 是 拒绝 原 假设 , 因 
为 这 时 的 p 值 是 用 x? 分 布 近似 的 ,这 时 有 必要 对 值 做 进一步 的 验证 , 即 求 出 
它 的 精确 p 值 ,这 就 要 借助 于 模拟 计算 . 
【 例 7.1】 为 确定 某 一 般 子 是 徊 均匀 ,将 其 抛掷 100 次 ,出 现 各 点 的 次 数 
如 表 7-1 所 示 . 











， 表 7-1 
点 1 2 3 4 5 6 
次 数 20 7 23 17 12 21 


用 表示 抛 撕 钥 子 出 现 的 点 数 . 设 H: 骨 子 是 均匀 的 , 即 PIX=i = 


i=1,2,…,6. 在 有 H, 下 ,出 现 个 点 的 理论 次 数 为 : nPIX=i| = 16.667. 且 
0 _(20 - 16. 667) , (7 - 16. 667) (23 - 16.667)” 
16. 667 16. 667 16. 667 
(17 - 16. 667)) 4 二 漠 667)? ， (21 - 16. 667) 
16. 667 16. 667 16. 667 
=11. 12 

其 p 值 为 0.049056, 与 0. 05 很 接近 ,难以 判断 是 否 接受 8,, 需要 进一步 抽样 
验证 .下面 用 计算 机 模拟 验证 : 

Step 1: 在 有 下 ,产生 n 个 相互 独立 的 随机 变量 了 ,7 ,天 ， 即 
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pty =i =p,,! 二 1 ,2 5 1 2 
» 1 。 1 k (NGC a np,)” 
Step 2: 记 NO =#1j:Y ”= 计 , 令 QQ = i 
其 中 # 表 示 计 数 . 
Step 3 :重复 Step 1 和 Step 2 ,得 到 m 组 相互 独立 的 数据 集 Y(® ,YY ，， ， 
¥* 和 00. 


Step 4: ! 的 个 数 : 


其 中 # 和 表示 计 数 . 
从 而 ,由 大 数 定律 , 80; > 上 的 比率 是 非常 接近 于 当 HH 为 真 时 8 > 上 的 概 
率 . 
其 R 程序 为 
exam7.1.1=function(m) | 
Q=0;N=rep(0,6) 
for(i in 1:m)| 
Y=sample(1:6,100 ,replace=TRUE) 
N=c(length(Y[Y==1]),length(Y[Y==2]),length(Y 
[r==3]), 
length(Y[Y==4]),length(Y[Y==5]),length(Y[Y== 
6])) 
Q[i] =sum( (N-100/6)’ * 6/100) 
} 
length( Q[ Q>=11.11978])/m 
| 
运行 exam7. 1.1(200000) 得 到 p 值 为 0.049005 , 据 此 不 接受 了 
2. 对 连续 数据 的 Kolmogrov-Smirnov 检验 


假设 连续 型 随机 变量 了 具有 分 布 函 数 下 , 从 中 得 到 相互 独立 的 观测 值 

Y, ,Y,,… ,Y,. 我 们 要 对 了 是否 具 有 分 布 函数 FF 进行 检验 , 设 零 假 设 
H。: Y 具 有 分 布 函数 FF， 

其 中 下 是 一 个 给 定 的 连续 分 布 函数 . 

由 离散 情形 的 检验 方法 可 提出 如 下 的 检验 H, 的 方法 : 

Step 1: 将 了 Y 的 可 能 取 值 集合 划分 为 个 不 相交 的 区 间 , 记 为 

(yo0571) (F172) (Tis7i)， 其 中 y=-% ,y=+ %. 
Step 2: 将 观测 值 Z 离散 化 为 了 = 1,2,…,n, 即 
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=i， 车 记 位 于 区 闻 (yi1 7). 
零 假设 蕴涵 着 
PIY”=i) =F(y) - F(y1), i=1,2,.…,k. 

Step 3: 运 用 xX 检验 对 之 进行 拟 合 优 度 检 验 . 

然而 ,有 男 外 一 种 检验 了 是 否 服从 连续 分 布 函数 严 的 检验 方法 ,这 个 方法 
比 离散 方法 更 有 效 . 其 方法 为 :根据 观测 值 内 ,Y; ,…， 忒 ,得 到 经 验 分 布 函数 
F,: 

#|i:Y, < x| 
F(x) 让 RE 
其 中 # 表 示 计 数 . 即 , F.(x) 是 观测 值 不 大 于 x 的 了 ;个 数 所 占 的 比例 . 因为 
F.(x) 是 观测 值 不 大 于 x 的 概率 的 自然 估计 量 ,所 以 ,如 果 零 假设 为 真 , 那 
么 F(x) 应 该 接近 F(x). 由 此 ,对 于 任意 的 x, 检验 及 的 统计 量 很 自然 地 为 

D = max | F.(%) 寺中 | ， 

其 中 最 大 值 是 对 整个 x e (- %,%) 而 言 . 统计 量 D 称 为 Kolmogrov- 
Smirnov 检验 统计 量 . 

对 于 给 定 的 数据 集 Y =y， ,j= 1,2,…,n, 将 之 从 小 到 大 排序 并 记 为 
yo yo 例如 ,着 n=3,y, =1,7 =3,ys =0, 那么 y=0,7y0w)=1， 
yd) = 3. 因此 F(x) 又 可 以 写 为 

0 ,基业 太 iiy 


1 
元 , 若 yo 之 %<Yya)i 


F.(x) = 


J 
,车 Yo EY < Yoni 


1 ,车 ix- 全 yd 
我 们 看 到 F.(x) 在 区 间 (yun ;7 0) 是 常数 ,而 在 点 J 0) 7 (2) » "Yn) 二 


有 一 的 跳跃. 因为 P(x) 是 x 的 单调 增 函数 , 且 以 1 为 其 界 ,从 而 F.(x) - 
F(x) 的 最 大 值 是 非 负 的 而 且 在 点 yo ,yo ,… ,yw 中 的 某 一 个 达到 .也 就 是 ， 
max | F(x) - F(x) | = max 人 位- Pryo)}: (F222) 

x j=],… .nln 


类 似 地 , F(x) - F,(x) 的 最 大 值 也 是 非 负 的 ,在 某 个 跳 区 点 y, 之 前 立刻 发 
生 , 所 以 . 
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ey 
max{ F(x) - F.(x)! = max {P(yo ) -过 下 (7.1.3) 


那么 由 (7.1.2) 和 (7.1.3) 看 到 ， 
D= max | F(x) - F.(x) | 


=max|max {F(x) - F(x)} ,max{F(x) -F(x)}} 


-max 人 位 -Poo) ,Fly0) -二 中， (7.1.4) 


(7.1.4) 可 以 被 用 来 计算 D 的 值 . 

如 果 将 观测 值 Y 代入 (7.1.4) 中 得 到 D=d. 若 4 的 值 大 , 则 表明 下 与 数 
据 是 不 一 致 的 ; 若 d 的 值 小 , 则 表明 下 与 数据 是 一 致 的 ;对 于 此 数据 集 ,p 值 为 

P 值 =Pi{D = di}， 

这 里 我 们 记 Ps 表示 在 假设 有 正确 时 计算 得 到 的 概率 值 . 

上 述 p 值 能 够 通过 一 个 模拟 近似 得 到 ,这 个 模拟 按 下 述 命 题 更 容易 进行 ， 
此 命题 表明 P; |D = dj 不 依赖 于 分 布 i. 此 结果 使 我 们 能 够 通过 做 一 个 具有 
任意 选择 的 连续 分 布 F 的 模拟 来 估计 p 值 [因此 允许 我 们 用 均匀 分 布 
U(0,1)]. 

命题 “对 任何 连续 的 分 布 PR, Pr|D = d} 都 是 相同 的 . 

证 因为 是 增 函 数 ,所 以 Y<x 等 价 于 F(Y) < F(x). 若 Y 了 有 连续 分 布 
F, 那么 随机 变量 F(Y) 服从 (0,1) 上 的 均匀 分 布 .从 而 有 


#{i:Y, < x| >d| 


PID>dl =Pr [max Oy 








n 


=Pr {max 





-Fr() |> dl 


=P{ max #{i:U, < F(x)) 
= n 





-PCD|> 中 ， 


其 中 U,,U,,…,U, 是 独立 的 (0,1) 上 的 均匀 随机 变量 . 令 y = F(x) ,并 注意 到 


x 在 从 - % 到 + % 取 值 时 , F(x) 的 取 值 为 0 到 1, 我 们 有 
PlD = dl| = P{ max > 中， 


yl n 





上 述 表 明 当 为 真 时 ,DD 的 分 布 不 依赖 于 分 布 F. 

由 上 述 命题 知 ,在 D 的 值 由 数据 确定 之 后 , 即 D=d, 则 p 值 能 够 通过 均匀 
分 布 U0(0,1) 模拟 得 到 .具体 来 说 , 先 产 生 n 个 随机 数 Ui ,UV,,…,U,, 然后 验 
证 下 述 不 等 式 是 否 有 效 : 

#|i:U, < y| 


n 


max 
Osys<l 





,|> d. (7.1.5) 
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这 样 重复 许多 次 ,此 不 等 式 有 效 次 数 的 比例 是 p 值 的 估计 量 :注意 到 不 等 式 
(7.1.5) 的 左边 可 通过 对 随机 数 排序 ,然后 用 等 式 
SO 一 全 全 — FPF(yw),F(y6;) -二 


j=12., 


max 
n 








而 计算 得 到 , 式 中 V 是 0 ,UV,,…,U, 中 的 第 j 个 最 小 的 值 . 例如 ,如 果 n=3， 
U, =0.6,UV, =0.5,D =0.4, 则 U0)=0.4,06y=0.5,U6)=0.6, 且 对 此 数据 
集 ,DD 的 值 为 


D = max 人 二 -0.4 二 -0.5,1 Re -可 ,0.6 -3}=0.4. 


【 例 7.2】 假定 我 们 要 检验 假设 :给 定 的 总 体 分 布 为 均值 为 100 的 指数 
分 布 ,也 就 是 (x) = 1 - e- 高 , 如 果 来 自 此 总 体 容量 为 10 的 样本 如 下 : 
71,198,139,145 ,21 ,31 ,47 ,122 ,146 ,109. 
问 这 些 数 据 是 否 来 自 均 值 为 100 的 指数 分 布 ? 
为 了 回答 上 述 问题 ,我 们 首先 利用 (7. 1.4) 来 计算 Kolmogorov-Smirnov 检 
验 量 D. 计算 D 值 的 R 程序 为 
X=c(71,198 ,139,145 ,21 ,31 ,47 ,122 ,146 ,109 ) 
Y=sort(X);M=0 
for(i in 1:10)| 
M[i] =max(i/10-pexp( Y[i],1/100),pexp(Y[i],1/100)-(i- 
1)/10) 
} 
d=max(M ) # d 为 D 的 值 
经 过 计算 得 D = 0. 2637835. 
也 可 直接 调用 R 的 内 置 函 数 ks. test(X,"pexp" ,1/100) 得 到 
One-sample Kolnogdtey- Sidiov test 
data: X 
D = 0.2638, p-value = 0.4173 
alternative hypothesis: two-sided 
我 们 也 可 以 通过 模拟 得 到 p 值 : 
exam7.2=function(n,d) | 
D=0;M=0 
for(iinl:n)| 
U=runif(10) 
V=sort(U) 
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for(j in 1:10) | 
M[j] =max(j/10-V[j],V[j] -=(j-1)/10)1 
D[i] =max( M) 
| 
length(D[D>=d])/n 
| 
运行 exam7.2(5000,d) 得 到 p 值 为 0.4208. 因为 bp 值 很 大 ,所 以 应 该 接受 
原 假设 . 


7.2 含 未 知 参数 单 样本 的 拟 合 优 度 检验 


上 节 介 绍 的 对 随机 变量 的 分 布 进行 拟 合 优 度 的 检验 ,都 不 含有 未 知 参 数 . 
本 节 将 对 含有 未 完全 指定 参数 的 概率 分 布 的 拟 合 优 度 检验 进行 介绍 . 
1. 离散 数据 情形 
如 果 要 拟 合 的 离散 型 随机 变量 了 的 分 布依 赖 于 7 个 参数 6 ,9,,… ,9,, 那 
么 我 们 提出 零 假设 
Ho,:Y 的 分 布 为 F(y;0, ,0,,… ,0,). 


解决 此 问题 的 步骤 是 : 

Step 1: 先 通过 观测 得 到 样本 了,Y, ，…,Y,. 

Step 2: 根 据 样本 了 ,Y,,… ,Y,, 利用 极 大 似 然 法 得 到 9, ,0,,… ,6, 的 极 大 
似 然 估 计 . 

Step 3: 再 运用 上 节 所 介绍 的 拟 合 优 度 x 检验 法 对 假设 H,:Y 
的 分 布 为 F(y;0, ,9,,… ,9,) 进行 检验 . 

【 例 7.3】 根据 下 列 数据 

T3473 572,60 .3758.21.3387 

检验 它们 是 否 来 自 一 个 参数 为 (8,p) 的 二 项 分 布 . 

假设 以 上 数据 来 自 总 体 X, 且 X 的 分 布 为 B(8,p). 即 

H,: XX 服从 二 项 分 布 B(8,p). 

根据 所 作假 设 有 似 然 函 数 : 


L(p)=pY"(Y -p)™ TZ =p*(1 -p)""™?, 
其 中 z= 上 上 如 %. 解 以 下 似 然 方程 
王子 
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dlogL(p) nx _n(m -%*) 的 


dp p 1-p 
得 到 p 的 极 大 似 然 估计 为 记 = 一 去 此 例 中 m= 8,5=44944444, = 0.6180555 


根据 下 述 程 序 可 计算 出 检验 的 p 值 . 

x=c(6,7,3,4,7,3,7,2,6,3,7,8,2,1,3,5,8,7) 

n=18 

N=c(0,1,2,4,1,1,2,5,2) # 样本 中 取 值 0~8 的 频数 

p=0 

p[1]=pbinom(0 ,8 ,0.6180555) 

for(i in 2.9)| 

p[i] =pbinom (i-1,8, 0.6180555) -pbinom(i-2,8, 0.6180555) 

| 

Q=sum((N-n*xp)“2VXCn*xp))=31.49933 

P 值 二 1-pchisq(Q,8)= 0.0001144661, 从 而 有 理由 拒绝 有 , 即 了 不 服从 
二 项 分 布 . 

现在 用 模拟 来 验证 上 述 检 验 的 p 值 ,其 步骤 如 下 : 

( i ) 指 定 模型 .假设 数据 值 X, ,X,,… ,X, 来 自 于 由 未 知 参数 89, ,9,,… ,6。 
确定 的 分 布 , 且 当 此 假设 为 真 时 , X; 的 可 能 取 值 是 0,1,… ,大 

( 站 ) 参 数 估计 . 用 数据 来 估计 未 知 参数 . 令 9 表示 bj = 1,2,… ,m, 的 信 
计 值 . 

( 道 ) 估 计 p;=PIX= 计 . 将 (让) 中 的 外 代 入 所 假定 的 分 布 ,估计 出 | 对 = 
让 的 理论 概率 . 

(iv ) 计 算 统计 量 0 的 值 .0= 半 “二 和， 其 让 必 是 数据 值 等 于 
i = 0,1,…,k, 的 个 数 , :表示 检 验 统 计量 8 的 值 . 

(VV) 模拟 . 现 做 一 系列 的 模拟 来 估计 检验 的 p 值 . 当 零 假设 为 真 且 0; 等 


于 其 在 (站) 步 所 确定 的 估计 量 6,j = 1,2,…,m, 时 ,总 体 分 布 得 到 确定 ;然后 
用 总 体 的 分 布 来 进行 模拟 : 


模拟 一 个 样本 容量 为 n, 来 自 于 上 述 的 总 体 分 布 , 并 令 0 (sim) 表示 0,， 
7 = 1,2,…,m, 的 基于 模拟 数据 的 估计 量 . 现在 确定 如 下 统计 量 的 值 : 
了 (N,— np (sim) )” 


Q (in) a 和 


本 n p; (sim ) 
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其 中 N, 是 模拟 数据 等 于 i,i = 0,1,…,k, 的 个 数 , 当 9) 等 于 9, (sim) ,j = 1， 
2,…,m, 时 , Pp; (sim) 是 p; 的 估计 量 . 
重复 模拟 多 次 .了 值 的 估计 量 等 于 Qi 兰 上 的 比例 : 
现在 我 们 根据 上 述 步骤 对 例 7.3 中 的 p 值 进行 验证 ,其 R 程序 为 
exam7.3.2=function(m,t) | 
Q=0;N=rep(0,9) 
for(iin 1l:m)!| 
p=0.6180555 
Y=rbinom(18,8,p) 
p=mean( Y)/8 
N =table(cut(Y,br=(-1):8)) 
q=0 
q[1] =pbinom(0,8, p) 
for(j in 2:9) | 
q[j] =pbinom(j-1,8, p)-pbinom(j-2,8, p) 
| 
Q[i]=sum( (N[]-18*q)’/(18*q)) 
| 
length(QLQ>=t] )/m 
| 
运行 exam7.3.2(10000,31.49933 ) 得 到 p 值 为 0.0107, 仍然 拒绝 H,, 即 
了 不 服从 二 项 分 布 . 
2. 连续 数据 情形 
如 果 要 拟 合 的 离散 型 随机 变量 了 的 分 布依 赖 于 7 个 参数 9, ,9,,… ,90,, 那 
么 我 们 提出 零 假设 
HH,:Y 的 分 布 为 F(y;0, ,0,,… ,0,). 
解决 此 问题 的 步骤 是 
Step 1 : 先 通过 观测 得 到 样本 Y ,YY, ,… ,YY,. 
Step 2 :根据 样本 Y, ,7,,…,Y,, 利用 极 大 似 然 法 得 到 9 = (650 ;9.) 
的 极 大 似 然 估计 9 = (0, ,9,,… ,0,). 
Step 3: 再 运用 上 节 所 介绍 的 拟 合 优 度 Kolmogrov-Smirnov 检验 法 对 假设 
H: Y 的 分 布 为 F(y;0, ,6,,…,6,) 进行 检验 . 
注意 ,在 此 处 运用 Kolmogrov-Smirnov 检验 法 时 , D = max, |F.(x) - 
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F(x) | ,其 中 已 (x) 为 由 观测 值得 到 的 经 验 分 布 函 数 , F;(x) 由 将 6 代入 分 
布 函数 (x;0) 而 得 到 . 

【 例 7.4】 某 班 有 70 名 学 生 , 其 成 绩 如 下 : 

61 ,74 ,61 ,66 ,82 ,67 ,60 ,71 ,68 ,65 ,74 ,66 ,80 ,88 ,86 ,70 ,88 ,89 ,68 ,60 ， 

67 ,85 ,81 ,87 ,71 ,71 ,78 ,93 ,90 ,88 ,72 ,80 ,89 ,80 ,93 ,90 ,90 ,86 ,95 ,87 ， 

92 ,57 ,63 ,76 ,68 ,62 ,85 ,66 ,64 ,49 ,78 ,60 ,69 ,65 ,83 ,89 ,89 ,86 ,93 ,76 ， 

93 ,90 ,62 ,79 ,76 ,69 ,74 ,76 ,87 ,67. 

试 检验 此 班 的 学 生 的 成 绩 天 服从 正 态 分 布 NC,o”). 

我 们 假设 丽 : 不 服从 N(Aic2). 在 有 下 ,得 到 似 然 函数 为 


L(u,0°) -ee| . 之 (xi Er 人 | 


2 
解 如 下 似 然 方程 : 
logL(p,0) __ 2 re =0 
NM 及 co tt 
dlogL(p,0) __ A PT 三 省 
ao” 20” 20° 


得 到 廊 =, 人 ?= 止 宁 ( 央 二 随 * 因为 二 下 (X- 如 ?不 是 0 的 无 偏 信 计 ， 


将 之 修正 为 样本 方差 5 = 一! 允 (多 - 到 ”将 观测 数据 代 人 上 式 ,得 到 估 


计 值 为 及 = 76.57143, cx? = 128. 5383. 计算 D 的 值 的 R 程序 为 
A=table( cut(X,br=c(40,59,69,79,89,100) ) ) 
mu=mean(X) ;sigma=sd(X) 
br=e(40 ,59 ,69 ,79 ,89 ,100) 

N=A[ ] 
M=0 
M[1] =max(sum(N[1])/length(X)-pnorm(59 ,mu,sigma)) 
for(j in 2:5)| 

M[j] =max(sum(N[1:j] )/length(X)-pnorm(59 ,mu,sigma) ， 
pnorm(59 ,mu ,sigma) -sum(N[1:(j-1) ])/length(X)) 
| 
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d=max( M) 
得 到 d = 0.9394117. | 
现在 可 通过 模拟 来 求 出 p 值 ,程序 如 证 : 
exam7. 4pvalu=function( m) | 
d=0 
for(iin 1l:m)! 
X=rnorm(70,76.57143 ,11.33747) 
X=rnorm(70 ,mean(X) ,sd(X) ) 
A=table(cut(X,br=c(0,59 ,69,79 ,89 ,100) ) ) 
N=A[];M=0 
M[1] =max(sum( N[1])/length(X)—pnorm(59 ,mu,sigma)) 
for(j in 2:5) | 
M[j] =max(sum(N[L1:j] )/length(X)-pnorm(59 ,mu,sigma) ， 
pnorm(59 ,mu,sigma) -sum( N[1:(j-1)])/length(X)) 
d[i] =max( M) 
| 
length( d[ d>=0.9394117])/m 
| 
运行 exam7. 4pvalu(10000 ) 得 到 p 值 为 0.2891. 当然 也 可 直接 调用 内 置 R 函 
数 得 到 : 
ks. test( X," pnorm" ,76. 57143,11.33747) 
One-sample Kolmogorov-Smirnov test 
data: X 
D = 0.1285, p-value = 0. 1978 
alternative hypothesis: two-sided 
也 可 用 PearsonX 检验 ,程序 如 下 : 
A=table(cut(X,br=c(0,64,69,79,89,100))) 
br=c(0,64,69,79,89,100) 
q=0 
p=pnorm(br[ -1] ,76.57143 ,11.33747 ) 
q=e(pll]j,pf2]-p[1],p[3]j-pl2],p[4]-p[3]j,1-p[4]) 
chisq. test(A,p=q) 
运行 上 述 程序 得 到 : 
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Chi-squared test for given probabilities 
data: A 
X-squared = 6.0523, df = 4, p-value = 0. 1953 
根据 上 述 的 p 值 都 大 于 0.05, 应 该 接受 H6, 即 认为 此 班 的 学 生成 绩 服从 
正 态 分 布 . 
一 般 来 说 ,Kolmogorov-Smimov 检验 不 需 将 样本 分 组 , 少 了 任意 性 ,所 以 
Klaus 检验 比 Pearson x 检验 更 有 效 . 


7:3 两 样本 问题 


假定 有 两 个 独立 的 观测 样本 X, ,X,,… ,X, 和 7, ,Y, ,… ,7Y,.. 我 们 要 检验 
这 两 个 样本 是 否 服从 同一 分 布 .于 是 我 们 提出 零 假设 : 
:这 n+ m 个 随机 变量 是 独立 同 分 布 的 . 
这 个 统计 假设 检验 问题 被 称 为 两 样本 问题 . 
为 了 检验 ,将 这 n+m 个 值 X,X,，,… ,X,Y ,Y,,…,Y, 进行 排序 ,并 暂 
时 假定 所 有 的 n+m 个 值 是 不 同 的 ,从 而 次 序 是 唯一 的 .对 i=1,2,…,n, 令 RR， 
表示 X, 在 这 n+m 个 值 中 的 秩 , 也 就 是 ,如 果 X, 是 在 n+m 个 值 中 第 j 小 的 值 ， 


则 R, =j. 统计 重 有 R= 隐 RR; 为 第 一 个 数据 集 的 秩 的 和 ,这 个 量 被 用 来 作为 我 们 


的 检验 统计 量 . (这 两 个 数据 集中 的 任何 一 个 都 可 以 看 做 “第 一 个 ”数据 集 . ) 

如 果 尺 非常 大 ,表明 第 一 个 数据 集 趋 向 于 比 第 二 个 数据 集 大 , 或 者 尺 非 
常 小 ,表明 第 一 个 数据 集 趋向 于 比 第 二 个 数据 集 小 , 则 拒绝 零 假 设 ;否则 接受 
零 假设 . 当 RR 的 观测 值 为 r- 时 ,如 果 Pj iR<r 或 者 Po 有 R> rr 非常 小 ,我 们 
拒绝 零 假设 ,否则 接受 零 假设 . 此 检验 被 称 为 两 样本 的 秩 和 检验 ,或 者 称 为 
Wilcoxon 两 样本 检验 以 及 Mann-Whitney 两 样本 检验 .事实 上 ,检验 数据 导致 
R =r 的 p 值 也 可 写 为 

P 值 =2min(Ps {R<r},P, {R=7|). (7.3.1) 

这 是 因为 当 RR 太 小 或 者 太 大 时 我 们 都 拒绝 思 , 所 以 p 值 是 这 两 个 情形 的 概率 
的 最 小 值 的 2 倍 .例如 ,假设 r.(” ) 使 得 在 假设 H, 下 获得 一 个 不 大 于 (不 小 
于 ) r.(~ ) 的 概率 为 0.05. 因为 在 H, 下 每 个 事件 发 生 的 概率 是 0.05, 所 以 当 
结果 是 r. (或 者 是 +”) 时 ,p 值 为 0.1. 

根据 (7.3.1) , 当 所 有 的 数据 不 同时 , 令 

全 Pa 1R <rl. 

为 了 计算 P, (7) , 我们 将 得 到 一 个 递归 方程 . 
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如 果 最 大 的 值 确实 被 包含 在 第 一 个 数据 集 , 此 数据 集 的 秩 和 等 于 n+m 
(最 大 值 的 秩 ) 加 上 其 他 的 n - 1 个 来 自 于 此 数据 集 的 秩 和 , 若 第 一 个 数据 集 
中 剩 下 的 ”- 1 个 元 素 的 秩 和 不 大 于 r -n-m 时 , 则 此 数据 集 的 秩 和 是 不 大 于 
r, 这 个 情形 以 概率 P,.,s(r - -m) 发 生 . 根据 类 似 的 讨论 ,我 们 能 够 证 明 如 
果 这 个 最 大 值 包含 在 第 二 个 数据 集 , 则 第 一 个 数据 集 的 秩 和 以 概率 P,。:() 
小 于 或 等 于 r. 最 后 ,因为 最 大 的 值 可 能 为 n +m 个 值 中 的 任何 一 个 ,所 以 这 个 


最 大 值 以 概率 一 = 一 为 第 一 个 数据 集 的 成 员 . 综 上 所 述 , 得 到 下 述 递 归 方 程 : 





n+m 
P, (7) 3— Ppl —_n-m)t+ Pp, 7. 3525 
上 式 可 由 如 下 边界 条 件 确定 ， 
a 


(7.3.2) 能 够 递归 的 解 得 到 Ps(r) = Pn |R<7| 以 及 P(r -1)=1-P。 
| 及 三 了. 

【 例 7.5】 测定 两 个 马铃薯 品种 的 淀粉 含量 (% ) 各 5 次 ,品种 A 和 品种 
B 观察 值 如 下 : 


A: 12.6, 12.4, 11.9, 12.7, 13.0; 
B: 13.4, 13.1,13.5, 12.7, 13.6. 
试 在 显著 性 水 平 为 a = 0. 05 时 检验 两 品种 的 淀粉 含量 有 无 显著 区 别 ， 
首先 提出 零 假设 甩 :两 品种 的 淀粉 含量 的 分 布 相同 . 将 马 铃 暮 品种 A 和 
品种 B 的 观测 值 进行 排序 , 见 表 7-2. 


















12.6 -2.7 ,2.7, v13.0,， 殷 ,4-- 起 电 .5 





通过 用 下 述 程序 先 求 出 4 的 观测 数据 的 秩 和 : 
X-c(12.6, 12.4, 11.9, 12.7, 13.0) 
Y2c(13.4,13.1,13.5,12.7,13.6) 
Z=c(X,Y) 
sum(rank(Z)[1:5]) 

得 到 r = 16. 5. 再 用 下 述 程序 得 到 p 值 : 


exam7. Sp=function(n,m,r) | 
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p=function(n,m,r) | 
if(n==l&m==0)1{1if(rc=0) P=0 else P=1 
| 

else if(n==0& m==1)| if(r<0){ P=0 |} else P=1 

| 

else if(n<0 || m<0){ P=0 | 

else 

P=n/(n+m) * Recall(n-l,m,r-n-m)+m/ (n+m) * Recall(n,m-l,r) 

return( 了 ) 

| 

pvalue=2 * min(p(n,m,r) ,1-p(n,m,r-1)) 

pvalue 

| 
运行 程序 exam7.5p(5,5 ,16.5) 得 到 p 值 为 0.03174603. 据 此 ,拒绝 有 H,, 即 认 
为 这 两 种 马铃薯 品种 是 不 同 的 . 

运用 递归 式 (7.3.2) 计 算 p 值 所 需要 的 计算 量 随 着 样本 容量 的 增加 而 变 
得 巨大 . 例如, 取 n=m = 20, 即使 我 们 选择 的 检验 量 是 比较 小 的 秩 和 ,但 是 可 
能 要 计算 20 x 20 x 410 = 164000 个 P,。(r) 的 值 . 因此 ,对 于 大 样本 来 说 ,运用 
递归 式 (7.3.7) 是 不 可 能 的 . 在 大 样本 情形 下 我 们 能 够 用 中 心 极 限定 理 得 到 R 
的 近似 分 布 ,也 可 用 模拟 算出 p 值 . 
为 了 得 到 R 的 近似 分 布 , 考 虑 在 Ho 下 ,这 nn +m 个 ,对 ,,…,X,。 和 卫 ， 

Y,,… ,了 的 值 中 ,每 个 值 的 秩 服从 1,2,… ,n+ m 的 均匀 分 布 .从 而 


1 
En[R]= DEnlR] =nx 


(nt+m)(ntm+1) 
说 
En LRR,] 二 En [RE [R j | R.]] 


i 


_ (n+m+1)[3(n+m) Me 


Varn,(R;) = 





12 
+m+l 
Covau (Ri,R;) = En [RR,] - E, LR:|E, [LR] =- 人 
5 n+m+l 
Vars,( R) 三 外 Varn,( R.) 宣 名 Cova(R;,R,) =nm* 一 
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所 以 在 甩 下 , 当 n 和 m 充分 大 时 ,由 中 心 极限 定理 知 R 近 似 服从 正 态 分布 . 
即 , 当 村, 为 真 时 ,有 
R-n(n+m+1)/2 
mn Pm Hi ZI2 
因为 对 标准 正 态 随机 变量 W, 当 r < E[W] 时 , PlW<ri 和 PiW 宇 7r) 的 最 
小 值 是 前 者 ,否则 是 后 者 ,从 而 当 n 和 m 不 太 小 时 (两 个 都 大 于 7 是 足够 的 )， 
我 们 能 够 得 到 R =r 的 p 值 为 


wm N(0,1). 


¥ n+m+l 
?全 -| ee (7.3.3) 
2PI|Z >r"}， 否则 ， 
其 中 
让 和 二 吕 革 二 
0 
12 

2 为 标准 正 态 随机 变量 . 


【 例 7.6】 用 大 白鼠 做 不 同 饲 料 喂 养 所 增 体重 的 比较 试验 , 先 将 大 白鼠 
按 性 别 、 月 龄 ,体重 等 配 为 10 对 ,再 把 每 对 中 的 两 只 大 白鼠 随机 分 配 到 高 蛋白 
组 或 低 蛋 白 组 ,喂养 8 周 得 到 增 重 (单位 :g) 的 观测 值 如 表 7-3 所 示 . 试 检 验 两 
组 大 白鼠 的 增 重 是 否 有 显著 的 差异 . 


表 7-3 大 白鼠 体重 增 重 ( 单位 :g) 观 测 值 
高 蛋白 组 体重 x, 135 120 131 130 139 138 136 137 134 130 
低 蛋 白 组 体重 Y. 124 124 131 118 132 132 136 127 127 117 


首先 提出 零 假设 : H,: 高 蛋白 组 与 低 蛋 白 组 大 白鼠 体重 增 重 无 显著 区 别 . 
将 浊 也 过 地 -= 1,2,…,10 混合 , 设 R 为 X| 2 在 这 ,YY 混合 后 秩 的 和 ， 
得 到 XX, 在 混合 后 中 的 秩 如 表 7-4 所 示 . 


表 7-4 高 蛋白 饲养 的 大 白 恨 体 重 增 重 观测 值 的 秩 
观测 值 x> | 135 120 131 130 139 18 16 137 134 130 





秩 R， 15 3 10.5 8.5 20 19 16.5 18 14 8.5 


从 上 表 可 计算 出 高 蛋白 组 观测 值 的 秩 和 7 = 133. 易 知 , E[R] = 105， 
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- 105 站- 105 , 
Var(R)= 175. 令 Z2=48 r” = = 2.116601, 则 P = 2P1Z 二 
ar(R) 令 J A 则 P bs 
0. 03429373. 据 此 ,有 理由 拒绝 有, 即 认 为 高 蛋白 组 i se 
大 白鼠 的 体重 的 增 重 有 显著 差别 . 


我 们 用 递归 式 (7.3.2) 得 到 精确 的 p 值 为 0.03546299, 与 0. 03429373 非 
常 接近 ,这 表明 当 n,m 充分 大 时 ,用 近似 正 态 分 布 进行 检验 的 效果 也 非常 好 ， 
而 且 也 很 容易 计算 . 
下 面 我 们 用 模拟 方法 来 计算 上 述 p 值 . 
Step 1: 将 XX, ,XX,,…,X, 和 YY,Y,,…,Y, 混合 后 记 为 2,,i=1,2,…,n+m,， 
并 将 Z 排序 ,得 到 其 对 应 秩 
Step 2: 令 2,,i = 1,2,…,n + m ,对 应 的 秩 为 R,i= 1,2,…,n +m. 
Step 3: 对 站 ;,i = 1,2,…,n ,所 对 应 的 秩 求 和 , 记 为 7. 
Step 4: 从 R;,i = 1,2,…,n +m ,中 随机 抽取 nn 个 数 , 令 其 和 为 R. 
Step 5: 重复 Step 4 上 次 . 邻 p = esr, - #8 则 p 
2 * min|p ,p;}. 
其 R 程序 如 下 : 
exam7. 6sim =function(k,X,Y) | 
Z=e(X,Y);R=0 
n=length(X);m=length(Y) 
rk=rank(2Z);r=sum(rk[1:n]) 
for(iin 1:k)| 
rksamp = sample( rk) 
R[i] =sum(rksamp[1:n]) 
} 
if(r<0.5*n* (n+m+l)) 
p=2* length(R[R<=r])/k 
else p=2 * length( R[ R>=r] )/k 
p 
| 
运行 exam7. 6sim(100000 ,X,Y) 得 到 p 值 为 0.03362. 
上 述 分 析 假 定 所 有 的 ” + mm 个 数据 是 不 同 的 . 当 这 些 数据 中 某 些 有 相同 的 
值 时 ,我 们 取 等 于 这 个 值 的 若干 数据 的 秩 的 平均 . 例如 ,如 果 第 一 个 数据 集 是 1， 
4,5, 第 二 个 数据 集 是 2,4,7, 那么 第 一 个 数据 集 的 秩 和 是 1 + 3.5 + 5 = 9.5. 
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两 样本 问题 的 推广 是 多 样本 问题 ,对 于 下 面 的 mm 个 数据 集 


i 有 二 i 
Xi X32 机 和 ? 
EN 疏 。2 用 


我 们 感 兴趣 的 是 检验 零 假设 加: 所 有 = 也 n 个 随机 变量 独立 同 分 布 .对 两 


样本 秩 检验 的 推广 称 为 多 样本 的 秩 检验 (通常 称 为 Kruskal-Wallis 检验 ). 其 
步骤 为 :首先 计算 出 所 有 个 数据 的 秩 , 然 后 令 R,,i= 1,2,…,m ,表示 来 自 于 
第 i 个 数据 集 的 所 有 n; 个 数据 的 秩 和 . 在 零 假设 到 下 ,假定 所 有 的 数据 是 不 
同 的 , 则 每 个 数据 的 秩 等 可 能 地 取 1,2,… ,n 中 的 任何 一 个 .我 们 有 
n+ 
E[R.] = mi x 全 
由 上 式 知 ,多 样本 秩 和 检验 统计 量 为 
n+ | 


R.-n. 

2 [Rm 

n(n+ ry n, 

易 知 RR 小 表明 H, 是 合适 的 , R 大 表明 ,不 合适 , 则 拒绝 所 . 如 果 R 的 观测 值 
为 R=r, 则 其 p 值 为 


2 








P 值 =Pi {R= 7}. 
对 充分 大 的 m ,ns，,…,n。 来 说 , R 近似 服从 一 个 自由 度 为 m -1 的 Xx 分 布 . 据 
此 ,p 值 可 由 下 式 近 似 得 到 
P 值 ~ Plxe- 7. 
【 例 7.7】 用 3 种 不 同 的 药剂 处 理 水 稻 种 子 ,发 芽 后 观测 到 苗 高 (单位 : 
cm) 的 观测 值 如 表 7-5 所 示 . 检验 3 种 药剂 对 水 稻 种 子 的 效果 是 否 有 差异 ? 


表 7-5 苗 高 的 观测 值 


21 ,24 ,27 ,20 


20 ,18 ,19 ,15 
22 ,25 ,27 ,22 





首先 提出 零 假设 有 :3 种 药剂 对 水 稻 种 子 的 效果 无 差异 . 将 各 组 样本 数据 
混合 后 由 小 到 大 排列 ,确定 各 个 数据 的 秩 R,, 并 计算 各 组 的 秩 次 和 R;, 如 有 
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相同 的 数据 可 同 取 平 均 的 秩 , 结 果 如 表 7-6 所 示 . 


表 7-6 各 观测 值 的 秩 






21(6) ,24(9) ,27(11:.5) ,20(4.5) 






20(4.5) ;18(2),19(3),15(1) 






22(7.5) ,25(C10) ,27CEE SA) 








计算 秩 和 统计 量 R 的 观测 值 
ea S 
rn 1) han = 7.221154 ， 


得 到 p 值 为 0.02703624. 据 此 ,有 理由 拒绝 H,, 即 认 为 这 3 种 药剂 对 水 稻 种 
子 的 效果 有 显著 差异 . 

例 7.7 的 样本 容量 n = 12 并 非 充分 大 ,而 我 们 用 近似 分 布 计算 p 值 可 能 
会 比较 粗糙 .下面 我 们 用 模拟 来 估计 p 值 . 其 步骤 为 

Step 1: 令 X,,i=1,2,…,m, 表示 第 习 组 观测 值 向 量 ,将 其 混合 后 排序 . 

Step 2: 令 R; 表示 第 i 组 数据 第 j 个 值 的 秩 , 令 尽 表示 第 i 组 数据 秩 的 和 . 


Dl 


n. 





Step 3: 计 算 r= 


Step 4: 从 R,,i = 1, 厅 故 所 上 呈 记 和 中 抽取 二 Dn 个 值 Yi， 
i=1 


J2 ， Yn 令 RR = 十 ya2 下 + yi， 不 = nl "Yn 2 Li i A 和 


上 1 二 i J 
2 





二 | 


R. -nn. 
12 a | -2 
S .全 尽 = 

tep 5: 令 RR i 





ni 
Step 6: 重 复 Step 4 和 Step 5k 次 ,计算 p 


其 R 程序 为 
exam7.7sim=function(k ,Xl1 ,X2 ,X3 ) | 
Z=e(X1, 2 XI) R= Omn=0r=0 
n[1]=length(X1);n[2]=length(X2) 
n[3]=length(X3);m=3;nsum=sum(n) 


_#{R>>r| 
i 
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rk =rank(Z) ; 
r[1]=sum(rk[l:n[1]]) 
for(iin2:m) {| r[i] =sum(rk[ (sum(n[1:(i-1)])+1):(sum(n 
[1:i]))])} 
rsum=12/(nsum * (nsum+1)) * sum((r-n* (nsum+1)/2)’/n) 
for(iin 1:k) | 
rksamp = sample( rk) 
r[1]=sum(rksamp[1:n[1]]) 
for(j in 2:m) | r[j] =sum(rksamp[ (sum(n[1:(j-1)])+ 
1):(sum(n[1:j]))]) } 
R[i] =12/(nsum * (nsum+1)) * sum((r-n* (nsum+1)/ 
2)/n) 
} 
length(R[ R>=rsum] )/k 
} 
运行 exam7.7sim(1000 ,X1;X2 ,X3 ) 1000 次 得 到 p 值 为 0.01433. 据 此 ,这 也 
表明 要 拒绝 思 , 同样 认为 这 3 种 药剂 对 水 稻 种 子 的 效果 有 显著 差异 . 


7.4 验证 非 齐 次 Poisson 过 程 的 假设 


考虑 一 个 数学 模型 ,此 模型 假定 每 天 来 到 者 按照 一 个 非 齐 次 的 Poisson 过 
程 到 达 一 个 系统 ,每 天 的 来 到 过 程 是 独立 同 分 布 的 ,但 未 指定 强度 函数 . 

为 了 验证 这 个 假设 ,假定 我 们 对 此 系统 观察 了 m 天 的 来 到 时 间 . 令 WN,,i = 
1,2,…,m, 表示 在 第 i 天 的 来 到 数 , 并 注意 到 如 果 来 到 的 过 程 确实 是 非 齐 次 
的 Poisson 过 程 ,这 些 量 是 独立 的 且 具 有 同样 均值 的 Poisson 随机 变量 . 因此 这 
个 结果 能 够 利用 Pearsonx” 拟 合 优 度 方法 进行 检验 . 在 此 根据 Poisson 随机 变 
量 的 均值 和 方差 相等 的 性 质 提出 另 一 个 更 有 效 的 检验 方法 . 如 果 N, 确实 是 来 
自 一 个 Poisson 分 布 的 一 个 样本 ,那么 样本 均值 


Ey N 
和 样本 方差 
了 1 _ Ny)? 
5 (N -N) 
大 致 相等 . 据 此 我 们 提出 下 述 假设 : 
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Ho :Ni; 是 独立 的 且 具 有 同样 均值 的 Poisson 随机 变量 ,i = 1,2,:… ,m. 

在 此 假设 下 ,我 们 构造 统计 量 : 

TS (7.4.1) 

N 
因为 当 7 的 值 很 大 或 者 很 小 时 ,都 表明 样本 均值 与 样本 方差 有 显著 差异 ,说明 
样本 N;,i=1,2,…,m ,不 是 来 自 同一 分 布 .对 于 给 定 的 观测 值 , 我 们 可 以 计算 
出 统计 量 了 值 为 i, 其 对 应 的 p 值 为 
pi =2min(Py {7T < 4} ,Pi (T=). 

然而 ,因为 H, 没有 指出 Poisson 分 布 的 均值 ,所 以 不 能 直接 地 计算 上 述 概率 . 


因此 我 们 首先 用 观测 数据 来 估计 此 均值 , 即 用 估计 量 入 = 和 作为 Poisson 分 布 
均值 的 估计 ,进而 得 到 z 值 的 估计 为 
pe = TN PS 

式 中 了 是 根据 式 (7.4.1) 而 定义 的 ,其 中 入 , ,NN,,…,N; 是 相互 独立 的 具有 均 
值 为 A 的 Poisson 过 程 .我 们 现在 通过 模拟 来 估计 P17T<i 直 和 P17 宕 .也 
就 是 ,我 们 连续 地 产生 m 个 独立 的 且 具 有 均值 的 Poisson 随机 变量 ,并 计算 
7 的 值 . 将 模拟 结果 满足 7 < tt 所 占 总 模拟 次 数 的 比例 作为 P17T < 4 的 估计 
量 , 并 将 模拟 结果 中 满足 7 三 1 所 占 总 模拟 次 数 的 比例 作为 PIT :| 的 估计 
量 . 

如 果 上 述 的 p, 很 小, 我们 就 拒绝 零 假设 本, , 即 认为 日 常 来 到 过 程 不 构成 
一 个 Poisson 过 程 . 然而 ,如 果 pi 不 小 ,这 仅仅 意味 着 每 天 来 到 数 服从 Poisson 
分 布 这 个 假设 是 可 行 的 ,而 据 此 不 能 识别 更 强 的 假设 及, :实际 来 到 模式 是 非 
齐 次 Poisson 过 程 , 且 每 天 都 是 相同 的 .为 了 验证 此 假设 及 ,, 我 们 进行 m 天 的 
观测 , 记 防 ,, ,于 ，… ,Xiw 为 在 第 JJ = 1,2,…,m ,天 各 个 来 到 者 到 达 的 时 间 . 
如 果 来 到 过 程 确实 是 一 个 非 齐 次 的 Poisson 过 程 , 则 能 够 看 出 这 普 个 数据 集 
ww = 1,2,…,m ,是 相互 独立 的 且 具 有 共同 分 布 的 随机 变量 . 
从 而 可 用 多 样本 的 Kruskal-Wallis 秩 检验 对 H, 进行 检验 .其 步骤 为 


Step 1: 计 算 N = > 个 数据 的 秩 . 


step 2: 令 R 表示 所 有 的 来 自 于 第 j 个 数据 集 的 V 个 数据 的 秩 和 . 
Step 3 : 记 
2 (二 
R= 天 + 本 N, 有 Se. 


则 RR 在 ,下 近似 地 服从 自由 度 为 r+ - 1 的 x 分 布 . 
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Step 4 :根据 观察 值 计 算 R 的 值 为 ">, 则 p 值 为 
Pa = 2min(Pn {IR<r| ,Ps IR=7r)) = 2min(Plx’, <r} ,Plx’, >= 7}). 

如 果 上 述 p, 以 及 前 面 的 p, 都 不 太 小 ,我 们 可 以 推断 数据 与 日 常 来 到 数 构成 一 
个 非 齐 次 的 Poisson 过 程 这 个 假设 是 一 致 的 . 

注 :在 多 样本 秩 和 检验 中 ,一 般 用 单 边 的 区 域 R > r 来 计算 P 值 ,而 在 此 处 
用 双边 区 域 Rr 或 者 R < 7 来 计算 (7.4.2) 中 的 p 值 .这 是 因为 一 个 多 样本 
秩 和 检验 假定 数据 来 自 m 个 分 布 且 这 些 分 布 相 等 时 , R 应 该 较 小 ,所 以 应 该 
用 区 域 R > r 来 检验 .但 是 ,对 于 一 个 周期 的 非 齐 次 的 Poisson 过 程 ,我 们 既 要 
检验 第 天 的 各 个 来 到 时 间 服 从 某 些 分 布 ,又 要 检验 每 天 的 来 到 时 间 的 分 布 
是 相同 的 . 而 比较 小 的 R 的 值 表 明 在 每 天 中 来 到 的 次 数 有 同样 的 Poisson 分 
布 , 较 大 的 R 的 值 说 明 每 天 内 各 个 来 到 时 间 可 能 不 是 独立 同 分 布 的 ,也 就 是 
Poisson 过 程 是 非 齐 次 的 ,所 以 用 双边 区 域 R > r 或 者 R < 7 来 检验 . 

【 例 7.8] 假定 记录 了 某 路 口 6 天 从 早上 8 点 到 下 午 6 点 这 10 个 小 时 
内 所 经 过 的 货车 次 数 及 时 刻 如 表 7-7 所 示 . 根据 此 观测 数据 检验 每 天 的 过 往 
货车 次 数 服从 非 齐 次 的 Poisson 过 程 . 


表 7-7 过 往 货 车 次 数 及 时 刻 表 
N, =51 
~ 0.118, 0.173, 0.184, 0.224, 0.346, 0.447, 0.576, 0.755, 0.928, 0.952, 1.366, 

1.445, 1.527, 1.700, 1.713, 1.999, 2.046, 2.081, 2.484, 2.548, 2.634, 2.679, 
2.771, 2.943, 3.122, 3.222, 3.588, 3.592, 3.931, 4.452, 4. 606, 4. 619, 4.677, 
4.797, 4.922, 4.922, 5.022, 5.414, 5.513, 5.817, 6.584, 6.938, 6.978, 6.994, 
7.124, 7.172, 7.321, 7.344, 8. 890, 9.162, 9.544 

N, =40 











0.159, 0. 305, 0. 392, 0. 403, 0. 417, 0. 684, 0. 814, 0.982, 1.093, 1.235, 1.384, 
1.493, 1.592, 1.705, 2.318, 2.471, 2.640, 2.756, 3. 120, 3. 302, 3. 320, 3.682, 
3.688, 4.205, 5.093, 5.185, 5.585, 5.695, 6.677, 7.065, 7.213, 7.545, 7.824, 
8.099, 8.260, 8.690, 8.785, 8.918, 9.612, 9.972 





N, =37 


0. 100, 0. 294, 0. 386, 0.727, 0. 780, 1.048, 1.245, 1.304, 1.352, 1.829, 1.992, 
2.156, 2.632, 2.636, 2.767, 2.795, 3.037, 3.281, 3.690, 3.696, 4.581, 4.905, 
5.083, 5.640, 6.116, 6.460, 6.979, 7.249, 7.473, 7.659, 7.867, 8.029, 8.682, 
8.915, 8.982, 9.183, 9.286 


186 








4 一 第 7 章 ”统计 模型 识别 方法 - 飞 


续 表 


N, = 36 


138, 0. 234, 0. 908, 0: 939, 0.990, 1.266, 1.589, 1.952, 2.068, 2.361, 2.710, 
501, 3.513, 3.967, 4.367, 4.451, 4.984, 5.157, 5.528, 6.551, 6.658, 7.432, 
755, 8.021, 8.061, 8.170, 8.288, 8. 325, 8.337, 8.427, 8.655, 8. 836 8: 895, 
.921, 9.235, 9.343 


om mm 


N, =32 


© 


161, 0.681, 0.714, 1.848, 1.914, 1.940, 1.995, 2.139, 2.329, 2.581, 3.390, 
.484, 3.629, 3.662, 3.933, 4.419, 4.422, 4. 864, 5.358, 5.913, 5.985, 6.106, 
.951, 6.969, 7.215,7.275, 7.342, 7.372, 8.432, 8.665, 8.706, 9. 120 


OO ww 


Ns =32 


© 


.078, 0.207, 0.217, 1.142, 1.415, 1.436, 1.530, 1.879, 2.207, 2.779, 3.050, 
.632, 3.657, 3.929, 4.532, 4.750, 5.174, 5.396, 6.386, 7.123, 7.291, 7.362, 
7.513, 7.625, 7.789, 7.947, 8.136, 8.166, 8.280, 8.984, 9.788, 9.890 


wD 


首先 提出 零 假设 Ho : 过 往 的 货车 数 N 服从 Poisson 分 布 . 计算 'N = 38， 
$ = 50, 得 到 7 的 观测 值 为 := 1.32. 调用 下 述 程序 : 
exam7.8=function(t,n,m,mu) | 
T=0 
for(iin1l:n)! 
N=rpois( m,mu) 
T[i] =var( N)/mean( N) 
| 
2 * min(length(T[T>=t])/n,length(T[T<=t] )/n) 
| 
通过 运行 exam7. 8(1.32,10000,6,38) 得 到 p 值 为 0.506. 据 此 ,接受 
8， 即 过 往 的 货车 数 w 服从 Poisson 分 布 . 
继续 提出 零 假 设 H,, :每 天 过 往 的 货车 数 N,,i=1,2,…,6, 为 相同 的 非 齐 
次 的 Poisson 过 程 .将 所 有 的 观测 时 刻 排序 ,得 到 每 天 的 过 往 货 车 时 刻 的 秩 和 
如 表 7-8 所 示 . 
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表 7-8 过 往 货 车 时 刻 的 牧 和 
秩 和 R, R, Rs Rs Rs Rs 
观测 值 5042 4258 4158 4792 3836 4020 


记 nm=N+mN+…+N, 则 nmn=228. 计算 统计 量 尺 的 观测 值 


[及 = 


12 
"二 Re 


i 





得 到 
p2 = 2min( 已 kxe < 7.49} ,Pilxi., > 7.49})= 0.374， 
由 此 接受 H,,, 即 认为 过 往 的 货车 数 N 服从 非 齐 次 的 Poisson 过 程 . 
如 果 一 个 非 齐 次 Poisson 过 程 通过 检验 认为 是 与 数据 一 致 的 ,那么 我 们 接 
着 就 要 对 此 过 程 的 强度 函数 和 (i) ,0 < tT 了 进行 估计 .在 齐 次 情形 下 ,显然 强 


~ 


度 函 数 的 估计 量 是 (1) = 信 , 其 中 外 是 在 长 度 为 了 的 一 天 中 到 达 的 平均 次 数 


的 估计 量 . 对 非 齐 次 Poisson 过 程 , 记 n = 2 N,, 令 7o =0， 对 =1 ,2 ,ny 记 


yi 表示 这 个 到 达 时 刻 中 的 第 个 最 小 值 . 因为 在 m 天 中 ,在 时 间 间 隔 (yy,， 
yi] ,k=1,2,…,n 上 仅 有 一 个 来 到 ,所 以 A(t) 的 一 个 合理 的 估计 量 为 

1 
(ye — 74) 
为 了 保证 一 天 来 到 的 货车 数 的 数学 期 望 为 N, 所 以 取 强 度 函 数 
ea 
站 m(7 ~ yt-1) 


A(1) = 当 yi 1 < 了 三 Mt 


当 y,., < 了 上 三 yi 


练 习 7 


1. 根据 遗传 学 理论 ,大 麦 的 杂交 后 代 关 于 芒 性 的 比例 应 是 无 芒 : 长 芒 : 
短 芒 =9 : 3 : 4. 实际 观测 值 为 335 : 125 : 160. 试用 Pearson x 检验 和 模拟 估 
计 p 值 ,进而 判断 观测 值 是 否 符 合理 论 假设 . 


2. 根据 Mendel 的 遗传 学 理论 ,一 种 开花 的 驴 豆 植物 将 分 别 以 概率 地 ， 


地 ,地 开 白色 、 粉 红色 或 者 红色 的 花 . 为 了 检验 这 个 结论 ,对 564 个 驴 豆 样本 


进行 研究 得 到 结果 如 下 : 141 个 开 白 花 , 291 个 开 粉 红色 花 , 132 个 开 红 花 . 分 
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别 用 Pearsonx” 检验 和 模拟 的 方法 估计 此 数据 集 的 p 值 , 判 断 此 数据 是 否 符合 
Mendel 的 遗传 学 理论 . 

3. 某 市 政局 为 了 考察 该 市 的 6 条 交通 要 道 是 否 具有 同等 流量 ,分 别 对 这 
6 条 交通 要 道 进行 了 为 期 一 个 月 的 观察 ,得 到 每 条 要 道 的 车 辆 数 (单位 :万 辆 ) 
分 别 为 

157 ,164 ,165 ,182 ,163 ,169. 

试 分 别 用 Pearsonx? 检验 和 模拟 的 方法 估计 此 数据 集 的 p 值 ,判断 此 6 条 交通 
要 道 的 流量 是 否 相 同 . 

4. 有 人 对 一 份 取 值 于 10,1,…,9} 中 的 250 个 数字 的 随机 数 表 , 进 行 了 如 
下 加 工 : 


数字 0 1 2 3 4 5 6 7 8 9 
观测 频数 17 31 29 18 14 20 35 30 20 36 


经 过 思考 ,他 认为 此 表 不 可 能 是 随机 的 . 试问 ,你 认为 他 的 怀疑 是 否 有 充 
分 的 统计 根据 ? 
5. 假设 以 下 18 个 点 的 集合 是 来 自 一 个 (20 ,40) 上 的 均匀 分 布 : 
36.4, 26.0, 31.2, 20.1, 39.9, 34.1, 29.5, 27.9,38.0, 
26.2, 35.7, 28.6, 24.9, 22.0, 21.7, 34.6, 38.2, 39.4. 
估计 此 假设 的 p 值 . 
6. 假定 从 一 批 电 子 元 件 中 抽出 10 个 测量 出 其 寿命 如 下 (单位 :小 时 ) : 
66,72,81,94,112,116,124,140,145 ,155. 
问 这 批 电 子 元 件 的 寿命 是 否 服 从 指数 分 布 并 估计 此 假设 的 p 值 . 
7. 假 设 在 30 天 的 时 间 段 内 ,有 6 天 没有 事故 发 生 , 有 2 天 有 一 起 事故 发 
生 , 有 1 天 有 2 起 事故 发 生 , 有 9 天 有 3 起 事故 发 生 , 有 7 天 有 4 起 事故 发 生 ， 
有 4 天 有 5 起 事故 发 生 , 有 1 天 有 8 起 事故 发 生 . 检验 这 些 数据 是 否 与 参数 
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A = 了 = 2. 9 的 Poisson 分 布 的 假设 一 致 . 


8. 产生 20 个 相互 独立 的 具有 均值 为 1、 方差 为 4 的 正 态 随机 变量 的 值 . 
试 利用 Kolmogorov-Simrnov 方法 ,估计 此 模拟 数据 确实 是 来 自 于 均值 为 1、 方 
差 为 4 的 正 态 分 布 的 p 值 . 

9. 对 一 台 设 备 进行 寿命 检验 ,记录 10 次 无 故障 工作 时 间 , 并 按 从 小 到 大 
的 次 序 排列 如 下 (单位 :小 时 ): 
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420 ,500 ,920 ,1380 ,1510 ,1650 ,1760 ,2100 ,2300 ,2350. 
试用 Kolmogorov-Simirnov 检验 方法 检验 此 设备 无 故障 工作 时 间 的 分 布 是 否 服 


从 参数 为 = j500 的 指数 分 布 ,用 模拟 估计 出 此 假设 的 p 值 


10. 为 了 比较 两 种 品种 的 水 稳产 量 ( 单 位 :kg) ,进行 田间 试验 ,得 到 调 产 
量 如 下 : 

品种 1 :446, 453, 451, 447, 447, 451, 453, 452, 444, 454; 

品种 2:494, 501, 503 ,486 , 498 , 498, 492, 499, 501, 499, 495 ,503. 
当 检 验 “ 假 设 : 这 两 种 品种 的 水 稳 亩 产量 相同 ”时 ,计算 精确 的 bp 值 . 

11. 观察 得 两 样本 值 如 下 : 

样本 I 2.36,3.14,7.52,3.48,2.76,5.43 ,6.54 ,7.41; 

样本 下 4.38,4.25,6.53 ,3.28 ,7.21 ,6.55. 
在 分 析 这 两 样本 是 否 来 自 同一 总 体 时 ,分 别 用 渐 近 正 态 和 模拟 的 方法 计算 p 
值 . 

12. 考虑 下 述 样本 的 数据 : 

样本 1 99.1,99.1, 95.9,94.0,97.8, 91.7, 98.0,97.2; 

样本 2 106.6, 104.4, 102.5, 109.6, 95.5, 98.1,108.8,105.1; 

样本 3 143,151, 146,148,165 ,103, 152, 100. 
当 检 验 所 有 的 数据 来 自 同 一 个 分 布 时 ,分 别 用 x 统计 量 和 模拟 的 方法 计算 p 
值 . 

13. 某 ATM 机 在 100 个 单位 时 间 内 ,有 18 个 顾客 光临 ,其 到 达 时 刻 如 下 : 

12 ,20 ,33 ,44 ,55 ,56 ,61 ,63 ,66 ,70 ,73 ,75 ,78 ,80 ,82 ,85 ,87 ,90. 

试 检验 到 达 过 程 是 一 个 ( 齐 次 )Poisson 过 程 并 估计 值 . 

14. 假 定 记 录 了 某 个 工厂 5 天 的 日 常 运输 次 数 . 在 此 阶段 每 天 的 运输 次 数 
如 下 : 

18 ,24 ,16 ,19 ,25. 
又 假定 根据 它们 到 达 的 时 间 安 排 102 次 的 运输 次 序 , 每 天 运输 的 秩 和 为 ; 
1010 ,960 ,1180 ,985 ,1118. 

用 上 述 数据 ,让 我 们 检验 “假设 :日 常 运输 到 达 过 程 是 一 个 非 齐 次 Poisson 过 
程 ”. 
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EM 算法 和 MCMC 方法 


在 统计 领域 里 主要 有 两 大 类 计算 问题 ;一 类 是 极 大 似 然 估 计 的 计算 , 另 一 
类 是 Bayes 计算 . 在 极 大 似 然 估计 计算 中 有 时 数据 是 缺失 的 ,我 们 用 EM 算法 
进行 估计 ;在 Bayes 计算 中 ,如 果 观 测 后 验 分布 是 复杂 的 、 高 维 的 、 非 标准 的 分 
布 ,我 们 可 以 用 MCMC 方法 进行 处 理 . 下 面 分 别 介绍 这 两 种 方法 . 


8.1 EM 算法 


EM( Expectation-Maximization ) 算法 是 一 种 迭代 方法 ,最 初 由 Dempster 等 
提出 ,主要 用 来 求 后 验 分 布 的 众 数 ( 即 极 大 似 然 估计 ) , 它 的 每 一 次 迭代 由 两 
步 组 成 :E 步 ( 求 期 望 ) 和 M 步 ( 极 大 化 ) .一 般 地 ,以 p(9|Y) 表示 9 基于 观测 
数据 的 后 验 分 布 密度 函数 , 称 为 观测 后 验 分 布 , p(8|Y,Z) 表示 添加 数据 Z 
后 得 到 的 关于 9 的 后 验 分 布 密度 函数 , 称 为 添加 数据 的 后 验 分 布 ; p(2Z | 9, 了 ) 
表示 在 给 定 9 和 观察 数据 了 下 潜在 数据 2 的 条 件 分 布 密度 函数 .我 们 的 目的 
是 计算 观测 后 验 分 布 p(9|Y) 的 众 数 ,EM 算法 按 下 述 步 又 进 行 . 记 9 为 第 
i + 1 次 迭代 开始 时 后 验 众 数 的 估计 值 , 则 第 i+ 1 次 迭代 的 两 步 为 

E 步 :将 p(9|Y,Z) 或 logp(91Y,Z) 关于 2Z 的 条 件 分 布 求 期 望 , 从 而 把 2 
积 掉 , 即 
QC910® ,YY AE,[logp(0|Y;2) 92 7] = Negp Ce | Y,Z)p(Z|0" ,Y)dZ. 

(8:1:1) 

M 步 :将 0(916",Y) 极 大 化 , 即 找 一 点 0“, 使 

Q(0"*Y 160 ,了 ) = maxQ(910 ,Y). (8.1.2) 
如 此 形成 了 一 次 迭代 6 一 9"*". 将 上 述 正 步 和 M 步 进行 迭代 直至 
I pn tn | 或 | Q(oO™" | 9 ,7) ~ 0(60 | 6 ,Y) | 充分 小 时 停止 . 

【 例 8.1】 (Rao(1965) ) 设 有 197 种 动物 服从 多 项 分 布 ,将 其 分 成 四 类 ， 

观测 到 的 数据 为 
191 





统计 模拟 及 其 及 实现 多 





y= (ii ya,ya,y4) = (125,18 ,20 ,34 ). 
再 设 属于 各 类 的 概率 分 布 为 


PRE 
其 中 0 e (0,1), 斌 估计 6. 
取 9 的 先 验 分 布 r(6) 为 (0,1) 上 的 均匀 分 布 , 则 8 的 观测 后 验 分 布 为 
p(0|Y)x 7(0)p(Y|0) 


bh 1 > 4 | 1 72 1 73 1 74 
(+ (#1 7 
cc (2 + 0)"(1 -00". | (8.1.3) 
令 L(9,7) = (2 + 0)"(1 -09)””0*, 对 (9,Y) 取 对 数 后 再 对 6 求 导 得 
dlog L(O,Y) 7 y+ 二 
db 和 
dlog L(0,Y) ，， g 二 、 
我 们 逢 一 为 得 分 函数 , 记 为 S(6). 为 了 得 到 6 的 极 大 似 然 估计 值 


6, 我 们 解 似 然 方程 
$(0)=0. 
用 如 下 R 程序 : 


S=function(x) + 


uniroot(S,c(0,1)) 
得 到 6 = 0. 6268219. 
下 面 我 们 用 EM 算法 来 求解 9. 现在 面 对 的 困难 是 在 (8. 1.3) 中 同时 出 
现 2+9,1-9 和 0, 为 了 将 2+9 拆 分 开 , 我 们 将 第 一 类 动物 分 为 两 小 类 , 落 于 
第 一 小 类 的 概率 为 二 , 落 于 第 二 小 类 的 概率 为 4 ,引进 潜在 变量 Z 表示 动物 


属于 第 一 小 类 的 种 数 , 则 y,- 2 为 动物 属于 第 二 小 类 的 种 数 . 从 而 得 到 9 的 添 
加 后 验 分 布 为 
pP(9|17Y,Z) ce mr(9)p(Y,Z 10) 


-0 二 Ee 风 人 
Wd 的) 人 


在 第 ;+ 1 次 迭代 中 假设 有 估计 值 9”, 则 可 通过 下 步 和 M 步 得 到 8 的 一 个 新 
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一 一 一 一 一 一 一 一 < 第 8 章 EM 算法 和 MCMC 方法 如 一 一 一 一 一 一 一 一 一 
的 估计 .在 卫 步 中 ,由 (8.1.1) 有 
Q(910®,Y)=E,[(y, - Z +y,)logh + (y, + ys)log(1 -9) 9 ,Y] 
=[y, - E,(Z|0",Y) +y,]log0 + (y, + y;)log(1 - 0). 





因 Z10”,Y 服 从 B(y,,- 0) ， 故 Es(216;Y) = 也 js 


2 
在 M 步 中 ,我 们 将 0(8|16"” ,7 了) 对 ER 0, 有 
Yr -ya -7Y5g ta -Es(Z 16",Y) 

_ 1590"” + 68 

119760 + 144 
根据 (8.1.4) 编写 迭代 程序 如 下 : 

exam8. ] =function(ep=1e-7)| 
theta=0.5;k=1 


pO'*Y a 


(8.1.4) 


repeat | 
k=k+1 
theta[ k ] =(159 * theta[ k—1]+68)/ (197 * theta[k-1]+144) 
if( abs(theta[ k ] -theta[k-1] )<ep) break 
| 
list( theta=theta[ k ] ,iter=k) 
} 
运行 exam8. 1( ) 得 到 9 = 0. 6268215. 
【 例 8.2】 如 下 数据 
3. S4 ,3. 90 ,3. 93 ,5. 19 ,3. 58 ,4. 60 ,3. 85 ,4. 69 ,4. 29 ,4. 067 ,3. 77 ,3. 45 ， 
5. 36 ,2. 62 ,4. 80 ,4. 65 ,3. 65 ,3. 67 ,6. 23 ,3. 35 ,1. 58 , -0. 19 ,-1. 89 ,0.08 ， 
0. 34 ,0. 90 ,-0. 03 ,0. 55, -0. 57 ,-1. 20 
可 能 来 自 于 正 态 分 布 N(0,1) 与 W(w,1) 的 混合 ,混合 比 为 1 -p 与 p, 且 0 < 
P< 1. 求 出 p 与 4 的 极 大 似 然 估计 . 
我 们 首先 给 出 其 混合 密度 : 
fyspsp)=p9(Y -1) + (1 -Pp)$(7), 


训 . 设 从 混合 分 布 中 抽取 样本 了 = (也 ,7 ，,…,Y,) , 得 到 其 





其 中 Pe 


似 然 函数 
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L(y,p;Y) = IToer =) (l= DP( TD): 
对 上 述 似 然 函数 取 对 数 得 


(up3Y) = 2 log(pb(Y, -1) + (1 -p)$(Y.,)) 
考虑 


ot(y,p;Y) 二 人 
a 
at (py,p;Y) Si 
op 
而 (8. 1.5) 也 很 难 直 接 用 数值 方法 得 到 其 解 . 下面 用 EM 算法 来 分 析 . 
我 们 引入 潜在 变量 Z = (Lis22 "2 ) ED 相互 独立 ,其 中 
Y, 来 自 正 态 分 布 N(k,1)， 
0, 若 了 ,来自 正 态 分 布 N(0,1)， 
以 及 P12Z,=1| =p,i=1,2,…,n. 我 人 有 Y|12Z,=1 ~ N(R,1),Y,|2,=0 ~ 
N(0,1). 则 (2Z,,7,) ,i = 1,2,…,n 的 似 然 函 数 为 


(8.1.5) 


L(p,p;Y,2) 3 TI (7 -1)"(l -p)' “由 ( 人 
对 上 述 似 然 函数 取 对 数 并 去 掉 与 p,p 无 关 的 量 得 
Cpps7,2)= BZlogp -TE ZY -AD + (n- EZ)los0 -p). 


假设 在 第 上 + 1 步 迭代 中 ,有 估计 值 h" ,p ,通过 卫 步 和 M 步 得 到 /4,p 的 新 
的 估计 值 4**n ,pe 在 EE 步 中 , 令 
QopRlp® sp ,= Bal Ci(pB3Y,2) ly ,pr »Y] 


= YE,[2. | mp ,Yjlogp 
iel] 

1 < (4) (hk) 2 
-E52 ?也 ,Y](Y. -1) 
+(n- BELZ. lp ,p™ ,7]) log( ls- pr 

im] 


易 知 


(k) (k) 
7 CD -~ 已;[ 义 Bi pe Y] LL Pp 中 ( Y -jh ) 
下 下 类 [& p 


oY -pp ) + -pp$ OY) 





在 M 步 中 , 解 
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90(pp 二 yk ,7) < 6 -9 ) Y. 一 三 0 
EE , 名 p $Y -pup ) + po) pr) ke 
aQ0pp lp pw _ 1 ,3 pb(Y, 二 NA ) 
ap 了 全 pOY -pp ) +( -pp G7) 
td = WS ) To =0 
1 -in 3 名 poOb(Z -90) +(1 py 
得 到 
by pb(Y, -je )Y. 
GD Pp $Y -pp ) +(l-p" )b(Y) 
下 3 pb(Y, -p'") , 
Ep bY -pp ) +(l -=p bY) 
TT 了 
Ee 2 pI $Y -pp ) +(l -pO(Y,). 
编写 R 程序 如 下 : 


exam8.2=function(Y ,ep=1e-5)!| 
phi=function(x)1/sqrt(2 * pi) * exp( -x’/2) 
p=0.6;mu=3.5;n=length( Y) 
k=1 
repeat| 
k =k+1 
p[k]=1/nx pfk-1] * sum(phi(Y-mu[k-1])/(pLk-1] 
* phi(Y-mu[k-1])+(1-p[k-1]) * phi( Y))) 
mu[k]=sum(phi(Y-mu[k-1l1]) * Y/(p[k=1] * phi(Y-— 
mu[l k-1]) 
+(1-p[k-1]) * phi(Y)))/sum (phi(Y-mulk-— 
1])/(p[k-1] *phi(Y-mu[l k=1]) 
+(1-p[k-1]) * phi(Y))) 
if(abs(p[k]-p[k-1])<=ep&abs(mu[k]-mu[lk-1])<= 
ep) break 
| 
list(p=p,mu=mu,iter=k—1) 
| 
运行 exam8.2(Y,ep=le-5) 得 到 人 和 p 的 估计 分 别 为 4. 13 和 0. 6728. 
EM 算法 的 最 大 优点 是 简单 和 稳定 .EM 算法 的 最 大 目的 是 提供 一 个 简单 
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的 迭代 算法 来 计算 后 验 众 数 (或 MLE). 我 们 不 禁 要 问 ,EM 算法 得 到 的 估计 序 
列 收敛 吗 ? 如果 收敛 ,其 结果 是 否 为 p(91Y) 的 最 大 值 或 者 为 局 部 最 大 值 . 为 
此 ,我 们 给 出 下 述 两 个 定理 .为 了 叙述 方便 , 记 估 计 序 列 为 0 ,i = 1,2,…， 
L(9|Y)= logp (901Y). 
定理 8.1 EM 算法 在 每 次 迭代 后 均 提 高 后 验 分 布 密度 函数 值 , 即 
P(9 | =p(0" | 了 ): (8.1.6) 
证 ”由 乘法 公式 有 
p(0,Z|Y)=p(2Z|0,Y)p(0|Y)=p(0|Y,2)p(Z1Y). 
将 上 式 后 两 项 取 对 数 有 
logp(0|Y)=logp(0|Y,2) +logp(Z|Y) - logp(Z10,Y). (8.1.7) 
设 现 有 估计 6”, 将 上 述 对 Z 关于 对 p(2Z | 9 ,7) 求 期 望 ,有 


logp(6 | Z)= [Tlogp C0| Y,Z) -logp(Z |0,Y) + logp(Z |Y)]p(2Z |192 ,7)dZ 


全 Q(8|6 ,了 了) 机 末 (8|160 ,7) 小 K(0'" ,了 ) ， 
(8.1.8) 
其 中 @(916",Y) 在 (8.1.1) 中 定义 ， 


H(010" ,Y) = Jlogp(2 |9,Y)p(Z|0",Y)dZ, 


K(6 ,7) = flogp(Z|Y)p(Z10" ,7)d2. 
分 别 在 (8.1.8) 中 取 6 为 62 和 8640 并 相 减 ,有 
logp(0'*" |Y) =- logp(b |Y)=[0(0|0"*",Y) - 0(0|10® ,7)] 
- [H(0|0"* ,YY) - H(0|0",Y)]. 


由 Jensen 不 等 式 , 知 
本 [le 外人 的) 10" ,下 < ol E10",y)} =0 


故 H(0160"*n,Y) -H(016”,Y) < 0. 又 09" 是 使 0(0169",Y) 达 最 大 的 ， 
故 
Q(0|0*",Y) - 0(0|0",Y) = 0. 

所 以 (8. 1.6) 成 立 . 

定理 8.2 (1) 如 果 p(9|Y) 有 上 界 , 则 ZL(9"”|Y) 收敛 到 某 个 忌 ”. 

(2) 如 果 0Q(9|g) 关于 9 和 9 都 连续 , 则 在 关于 上 的 很 一 般 的 条 件 下 ,由 
EM 得 到 的 估计 序列 6” 的 收敛 值 06” 是 工 的 稳定 点 . 

证 由 定理 8.1 及 单调 收敛 定理 易 知 论断 (1 ) 成立. 论断 的 证 明 参 见 Wu 
(1983 ) 定理 1. 
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定理 8.2 表明 EM 算法 的 结果 只 能 保证 收敛 到 后 验 密度 函数 的 稳定 点 ， 
并 不 能 保证 收敛 到 极 大 值 点 :事实 上 ,任何 一 种 算法 都 很 难保 证 其 结果 为 极 大 
值 点 .通常 选取 几 个 不 同 的 初 值 进行 迭代 ,然后 在 诸 估 计 间 加 以 选择 ,以 减少 
初 值 对 结果 的 影响 . 


8.2 MCMC 方法 


上 一 节 介 绍 的 EM 算法 得 到 的 是 后 验 分 布 的 众 数 (或 MLE) ,有 了 时 我 们 希 
望 得 到 后 验 分 布 的 一 些 其 他 特征 ,比如 后 验 均 值 \ 后 验方 差 、 后 验 分 位 数 等 . 计 
算 这 些 后 验 量 都 可 归结 为 关于 后 验 分布 的 积分 计算 .具体 地 , 设 mz(*) 为 后 验 
分 布 ,我 们 要 计算 的 后 验 量 可 写成 某 函 数 /(x) 关于 mr(*) 的 期 望 


Ef = [f(x)n(x) dr. CBE) 


对 于 较 简 单 的 后 验 分 布 ,我 们 可 以 直接 计算 (8.2.1) 或 利用 数值 积分 等 近似 
方法 进行 计算 .但 当 后 验 分 布 很 复杂 时 ,这 些 方法 都 很 难 实施 ,特别 是 在 实际 
中 ,观测 后 验 分 布 往往 是 复杂 的 、 高 维 的 、 非 标准 形式 的 分 布 ,而 Markov Chain 
Monte Carlo( MCMC) 方 法 就 是 最 近 发 展 起 来 的 解决 此 类 问题 的 行 之 有 效 的 方 
法 . 尽管 在 统计 物理 学 中 得 到 广泛 应 用 已 有 40 多 年 历史 ,但 它 在 Bayes 统计 、 
显著 性 检验 、 极 大 似 然 估 计 等 方面 的 应 用 却 是 近 十 年 来 的 事情 . 

MCMC 方法 的 基本 思想 是 通过 建立 一 个 平稳 分 布 为 r(x*) 的 Markov 链 
来 得 到 一 个 样本 ,基于 此 样本 进行 各 种 统计 推断 . 例如 , 若 要 估计 已 。j, 若 
7(%) 是 比较 简单 的 分 布 ,我 们 可 以 通过 静态 的 Monte Carlo 方法 产生 独立 的 
随机 样本 ,应 用 大 数 定律 就 可 估计 出 来 . 如 果 zr(x) 是 比较 复杂 的 分 布 ,就 从 
具有 平稳 分 布 r(x) 的 Markov 链 中 产生 样本 也 ,,X,,… ,XX,, 则 由 遍历 性 定理 
可 得 到 E,f 的 估计 为 


Ej= Ek). 
因为 Markov 链 经 过 一 段 时 间 后 才 比 较 稳 定 ,所 以 在 估计 时 将 前 闫 个 迭代 值 去 
掉 , 而 用 后 面 的 n - m 个 迭代 结果 来 估计 , 即 
2 1 是 
所 7= EA). 


从 模拟 的 角度 看 ,我 们 构造 的 转移 核 使 已 知 的 概率 分 布 n(x) 为 平稳 分 布 . 因 
此 ,在 采用 MCMC 方法 时 ,转移 核 的 构造 具有 至 关 重 要 的 作用 ,不 同 的 MCMC 
方法 ,如 Gibbs 抽样 法 、Metropolis 方法 等 ,往往 也 只 是 转移 核 的 构造 不 同 . 这 
将 在 后 面具 体 介绍 . 
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现在 我 们 把 MCMC 方法 概括 为 如 下 三 步 : 
(1) 在 状态 空间 S 上 构造 一 个 具有 转移 核 为 p(;) 的 Markov 链 ,使 其 平稳 
分 布 为 7(*%). 
(2) 由 8& 中 某 点 各 出 发 ,用 (1) 中 的 Markov 链 产生 点 列 丽 ,于 开 
(3) 对 某 个 m 和 大 的 n, 任 一 函数 f(x) 的 期 望 估计 如 下 


Ej- LAX). 


在 做 模拟 时 条 件 分 布 起 很 大 作用 ,下 面 我 们 考虑 MCMC 方法 的 应 用 条 件 . 
人 (生生 {x7 < 计 , 则 有 


T(x)= T(x | xo ) mr (x | xo 2 | xx i - [Tr | wi 


人 

如 果 (8. 2.2) 中 的 每 一 个 7(x; [|x.) 都 容易 抽样 就 只 需 用 前 面 的 方法 
而 不 需 用 MCMC 方法 . 但 在 实际 中 很 难 做 到 这 点 ,因此 需要 动态 模拟 . 此 时 ， 
满 条 件 分 布 扮演 一 个 重要 角色 . 

1. 满 条 件 分 布 

记 稚 = 1 ,22 守 TCHN, xi = 1s 1 ET Yi 全 Irie 7 下 
T(xr |x.r) 为 满 条 件 分 布 .也 就 是 ,所 有 的 变量 全 部 出 现在 条 件 分 布 中 . 我们 
注意 到 


T(x) 


n(xr |x) = x T(x). (8.2.3) 


[r(x) de 
车 wi! ee 肖 t 呈 =yx' 7， 则 
厅 ( 和 | x27) rx’) 
T(xr|xr) T(x) 
在 (8.2.3) 和 (8.2.4) 中 去 掉 了 一 些 正 则 化 常数 ,这 些 常 数 一 般 很 难 计算 出 
来 ,这 也 是 MCMC 方法 的 一 个 方便 之 处 . 
【 例 8.3】 设 随机 变量 (X,Y) 的 联合 密度 函数 为 


(8.2.4) 


nl! x n-x+l 
Te i 


其 中 ,x=0,1,…,n,O0O<y<1. 
易 知 满 条 件 分 布 为 


T(x%,y) = 


T(x|y)=B(n,y), 
以 及 
nT(y|x)= Beta(x +1,n-x+2), 
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其 中 Beta(x;a,b) 分 布 的 密度 函数 为 
TFT(a +D) 
T(a)T(6b) 
设 y 为 观测 数据 , x = (9,p,z)， 其 中 0,p,z 分 别 表 示 参 数 、 超 参数 和 缺失 数 
据 . 则 r(x) 可 写 为 T(z| 7)， 

T(z|y) «p(y,z|0)n(0| 9) 7p), 
其 中 p(y,z19) 表示 完全 数据 的 密度 函数 ,7(91 gq) 表示 先 验 分 布 , r(9) 为 
超 参 数 的 分 布 . 由 (8. 2. 11), 各 变量 的 满 条 件 分 布 可 给 出 如 下 : 

T(b 9.,9,z,) < p(y,2|10)7(0;|0.;,9), 
T(p|0,9u 2) Ee mr(0|9) np), 
T(z | 0,p,2-.,)) cc p(y,2 | 0) ， 
其 中 0.; = 10:] 天 这 902-k 类 似 定义 . 
【 例 8.4】 设 观 测 变量 了 = (Y,,Y,,…,Y,) 具有 如 下 分 布 : 
Brie 
I 


p(xsa,b) = i 





7(y,|k,0,A)= 了 2 


mT(yi | kG A i=k+1,k+ 
再 假定 各 参数 的 先 验 分 布 为 
7(0|16,)= Gamma(0.5,b,), 
7(A|b,)= Gamma(0.5,b,), 
7(b,)= IG(0,1), 
7(b,)=1G(0,1), 
T(k)= Uniform(1,2,.…,n), 
其 中 ,9; 和 条 件 独立 , bi ,6b; 独立 ,以 及 
Gamma(l a,B)= 


1 a-l] -~ 


x 让 
Tta)p- 





1G( m8) gs 
Unifom( 全 入 澡 内 ) 到 演 加 有 = 二 ,j= TR 
其 中 a 称 为 形状 (shape) 参 数 , B 称 为 刻度 (scale) 参 数 . 易 知 后 验 分 布 为 
Tm(k,0,A,b,b, | = Jr 也 146.A) [rl lk,0.) 
和 op 
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1 -0.5 -所 ee 1 
FO 
各 参数 的 满 条 件 分 布 为 
k Ee 
0 e 1 人 二 





T(b | 大,A ,bb ,了 了 ) < T(0.5)b"s 


k 
ce 0 Yi-0.s 6 -0( #47) 





~ ie yr Hb 元 FE 


A rie 1 人 -05e- 访 
CE 





7T(A | ,0,b, ,b,,Y) ce 
i=k+ 


cc Gammal 5 丙 ) ， 
训 Wd 
= 








7(k|0,A,b,b,,7) ~ II A 
i=k+1 i” t+1 
Eg GE Se- 

二 ， 


wtb | kd. A BY & 和 Ty 
pb 





bi +0 
< 机 e 司 -45 - 赴 Ey 1 
mr(b, |k,0,A,bi,Y) a bon 1G(0.5, ng 
2. Gibbs 抽样 
现在 介绍 MCMC 方法 中 的 Gibbs 抽样 , 它 是 由 S. Geman 和 D. Geman 在 
1984 年 提出 的 ,主要 解决 高 维 随机 变量 的 模拟 ,其 具体 内 容 如 下 : 
设 下 = (XX ,X,,… ,XX,) 的 密度 函数 为 (x), 对 任意 指定 的 7CN, 在 给 
定 怀 -7 =x_y ee 人 
= CK Me 
而 X; 具有 密度 函数 | x-_ 则 对 任 一 可 测 集 B， 
PIX' eB} = | mx) rss |x_7) dx’ =|r(z)dx =7(B). 
由 此 知 , X' 的 密度 函数 与 X 的 密度 函数 相同 ,也 是 zr(x%). 
此 过 程 定义 了 一 个 由 了 到 X' 的 转移 核 , 且 其 相应 的 平稳 分 布 为 r. 这 样 
构造 的 MCMC 方法 称 为 Gibbs 抽样 (Gibbs sampler). 当 7 只 含 一 个 元 素 时 称 
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为 单元 素 Gibbs 抽样 (single-site Gibbs sampler). 若 7 了 = | 让 ,单元 素 Gibbs 抽样 
是 在 给 证 do 的 消 亲 
件 分 布 抽样 ,因为 它 只 涉及 单 变量 抽样 ,非常 方便 ,从 而 使 之 极 具 吸 引力 . 

我 们 假设 具有 密度 函数 7(x), 对 碟 进 行 Gibbs 抽样 的 步骤 如 下 : 

首先 给 出 初始 点 x"” = (x1”,%x4”,… ,xs”). 假定 第 :次 迭代 开始 时 的 估 
计 值 为 x“”，, 则 第 :次 迭代 又 分 为 如 下 n 步 : 

(1) 由 满 条 件 分 布 (x, |x, ”,… ,x,"，”) 抽取 x,"". 


(让 由 满 条 件 分 布 T(x; | x1?… ,xz x) 抽取 x 

(n) 由 满 条 件 分 布 7(x, | x ,… ,x ) 抽取 %,”. 

记 zx 中 =(x,… x) , 则 zx 中,… ,x ,… 为 n 维 Markov 链 的 实现 .其 由 x 到 
x' 的 转移 概率 函数 为 

Plsox Y= mR | me | 
易 知 7(x) 为 此 Markov 链 的 平稳 分 布 . 

上 述 得 到 了 一 个 Gibbs 抽样 序列 ,那么 这 样 得 到 的 Gibbs 抽样 序列 是 否 收 
敛 呢 ? 至 今 还 没有 一 个 简单 而 有 效 的 方法 来 判断 . 在 实际 中 ,通常 采用 以 下 两 
种 直观 的 方法 来 判断 . 

方法 一 是 用 Gibbs 抽样 产生 多 个 Markov 链 , 在 经 过 一 段 时 间 后 ,如 果 这 
几 条 链 稳定 下 来 , 则 表明 Gibbs 抽样 收敛 . 

方法 二 是 每 隔 一 段 时 间 取 一 个 样本 计算 其 平均 值 . 当 这 样 算得 的 均值 稳 
定 后 ,就 可 认为 此 Gibbs 抽样 收敛 . 

【 例 8.5】 设 观 测 变 量 Y,Y,,…,Y 独立 且 服 从 Nu,o2)， (Ac ) 的 先 


验 分 布 为 7(j,0?) 时 六 令 Y=(Y,,，,…,Y,) ,了 的 观测 值 为 y( 表 8-1) , 估 


计 E(y|Y=y) 和 E(o’ |Y=y). 


表 8-1 观测 值 y 


1.749 -0. 085 0. 802 1. 182 0. 617 1. 023 0. 528 0. 502 1. 242 0. 929 1. 820 2. 148 0. 677 1. 220 
0. 061 0. 732 0. 149 1. 604 0.917 1. 041 0. 024 1.712 1. 241 1.573 1.080 0.962 1.061 2.012 
1.612 0. 535 1. 087 0. 658 1. 279 0. 934 1. 068 1. 368 0. 549 1. 105 0. 621 1. 857 0. 698 0. 872 
0. 069 0.725 0. 865 1. 179 1. 381 2. 230 0. 616 1. 282 


首先 计算 (4,o ) 在 Y=y 的 条 件 下 的 后 验 分 布 : 
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pn he ee 
2c: 


则 易 知 (w,e- ) 的 满 条 件 分 布 为 


Tplo,y) ce “ol. 2 do | x N(7,) ， 
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20 
我 们 根据 上 述 满 条 件 ,编写 R 程序 如 下 : 


exam8.5=function(y,n,a,b) | 


全 +1 - es 2 n 2 z 
mr [a ( 己 co 2 9 -p) |- 二 六 | 


th=matrix(0 ,ncol=2 ,nrow=n) 
m=length(y) 
th[1,]=c(a,b) 
for(i in 2:n) | 
th[i,1 ] =morm(1,mean(y) ,sqrt(th[i-1,2]/m)) 
th[i,2] =1/rgamma(1,m/2,sum( (y-th[i,1])’)/2) 
| 
list(mu=th[ ,1] ,sig2=th[ ,2]) 
} 
给 定 (1,0°) 的 初始 值 为 (a,b) , 运行 exam8.5(y,5000,1,0.25) 得 到 Markov 
链 的 一 个 实现 ,如 图 8-1, 得 到 jw,o 的 MCMC 的 估计 为 =1.0,0 =0:31. 而 
2 (yi -7)” 
po; 的 理论 值 E11y) = 了 =1.0,E(o*17)= 全 一 3 一 =0.31. 说 明 模拟 
效果 非常 好 . 
【 例 8.6】 设 X.,i=1,2,3,4,5, 是 相互 独立 的 指数 随机 变量 , 且 X; 有 均 
值 i, 试用 模拟 来 估计 


p=P{ 1] > 120 | Zs} 


首先 ,假设 XY 和 了 Y 是 独立 的 分 别 具 有 速率 和 A 和 的 指数 随机 变量 ,其 中 
< A. 在 给 定 X+Y =a 的 条 件 下 X 的 条 件 分 布 如 下 : 
fx | xr(% | a) =Cifr,r(x,a -%) (0 <x <a) 
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0 1000 2000 3000 4000 5000 0 1000 2000 3000 4000 5000 


图 8-1 和 oo? 的 模拟 图 


=C,e "ert" 
=C,e ts 
上 式 表明 X 的 条 件 分 布 是 速率 为 A- 的 指数 分 布 ,此 处 < a. 下 面 给 出 模 
拟 的 步 又 : 


党 
Step 1 : 令 初始 状态 为 zo = (zt ,zt ,x ,4 x9), x >0 目 = 
i=1 
15; 


Step 2: 从 集合 1,2,3 ,4,5 中 随机 地 选择 两 个 元 素 1 和 J, 且 1 < 了 将 部 
和 已 看 做 变量 , 记 3 = XX + XX,. 

Step 3: 在 给 定 条 件 5 =X+ X= 15 - 也 二 下 ,从 参数 为 地- 的 指 
数 分 布 中 抽取 随机 变量 X, 用 = X, = =X 更 新 x。 中 对 应 位 置 的 值 , 其 
他 人 奏 置 的 值 保持 不 变 ,从 而 得 到 x;. 

Step 4: 重 复 Step 2 和 Step 3 得 到 序列 x ,zj ,…. 

Step 5 :计算 状态 序列 x。,x,,… 满足 了“ > 120 的 比例 , 即 为 8 的 估计 . 


其 R 程序 为 


exam8.6=function(n,x0,d)| 
k=0 


X=matrix(0,nrow=n,ncol=5) 
X[1,]=x0 
for(iin1:(n-1))! 
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I=sample(1:5,2) 
I=sort(I) 
X[i+1l,]=X[i,] 
X[i+1,I[1]]=rexp(1,1/I[1]-1/I[2]) 
X[i+1,I[2] ] =X[i,I(1]]+X[i,I[2]]=X[i+1,I[1]] 

} 

for(j in 1:n) | 
这 (prod(X[j,])>d)k=k+l 

| 

k/n 

} 
运行 exam8.6(10000,1:5,120) 得 到 估计 为 Bb =0: 1391, 
3. Metropolis-Hastings 方法 


上 节 介 绍 了 Gibbs 抽样 方法 ,本 节 将 介绍 比 Gibbs 抽样 方法 出 现 更 早 、 也 更 
一 般 的 MCMC 方法 ,也 就 是 Metropolis-Hastings 方法 . Metropolis 等 人 在 1953 年 
提出 了 一 种 构造 转移 核 的 方法 ,Hastings 随后 对 之 进行 推广 ,形成 Metropolis- 
Hastings 算法 ,其 主要 思想 如 下 : 

任意 选择 一 个 不 可 约 具 有 转移 概率 9(`，') 的 Markov 链 |Y.,t 宇 0}, 以 
及 一 个 函数 a(',:),0 <a('，) 和 1, 对 任意 的 状态 (x,x ) (xz 关 2)， 定 义 

p(x%,x’) = q(x,x’)a(x,x’), XX". (C8; 23) 

则 p(x,x') 形成 一 个 转移 核 . 记 具 有 转移 核 p(x,x') 的 Markov 链 为 1X,,t 二 
0}. 

(8. 2.5) 表明 如 果 链 在 时 刻 i 的 状态 为 X, =*, 则 首先 由 g(: |x) 产生 一 
个 潜在 的 转移 x 一 x', 然后 根据 概率 a(x,x') 决定 是 否 转 移 .也 就 是 说 ,在 潜 . 
在 转移 点 x' 找到 后 ,以 概率 a(x,x’) 接受 * 作为 链 在 下 一 状态 值 ,而 以 概率 
1 -a(%;%') 拒绝 转移 到 x', 从 而 链 在 下 一 时 刻 仍 处 于 状态 x. 于 是 ,在 有 了 2 
后 ,我们 可 从 (0,1) 上 的 均匀 分 布 抽 一 个 随机 数 uw, 则 

到 be <a(x,x’), 
Xu > a(ww'). 

一 般 ,分 布 g(* |x) 称 为 建议 分 布 (proposal distribution). 

因为 我 们 的 目标 是 使 后 验 分 布 "(x) 成 为 Markov 链 {X,,t 二 0| 的 平稳 
分 布 . 故 在 有 了 g(*,*) 后 ,应 选择 一 个 w(`，') 使 相应 的 p(x,x’) 以 77(x) 
为 其 平稳 分 布 . 通常 的 选择 是 
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X_xX') = min T(x ) g(x ,x) 地 3 
Q(x,x’)=m [1 (8.2.6) 
此 时 ,有 
9(x,x' ) T(x')q(%' x) > T(x) q(x,x ), 
plws%') = 7 多 





9(e) DEY, me) gs) < (2)9(x,z)， 


(8.2.7) 
具有 转移 核 (8.2.7) 的 Markov 链 有 如 下 性 质 . 
性 质 8.1 具有 转移 核 (8. 2.7) 的 Markov 链 是 可 逆 的 , 即 
T(x)p(x,x')= T(x )p(x' ,x), (8.2.8) 
且 7(x) 是 由 (8.2.7) 确定 的 Markov 链 的 平稳 分 布 . 
证 若 x =x', 则 式 (8.2.8) 显然 成 立 . 设 x 关 x', 则 


,ry hha i als’) 
Ts)plz sr)= rls) g(r ) min1, Te 
=min{ r(x)g(x,%x’) ,mT(x’)q(x’ ,x)} 
a 1 : n(x’) a) 
=7(x’)q(x ,) min{ S00 ,1 
= 7(x')p(x’ ,x). ; 
故 (8.2.8) 成 立 .对 (8.2.8) 两 边 同 时 关于 x 积分 ,有 


[rz)p(zz)dz = [=(x')P(x'z)dz a n(x’) p(x' ,4) ds =7(%'). 


假设 和 X,,t 宇 01 为 可 道 的 不 可 约 Markov 链 , 其 状态 空间 为 $= 11,2,…， 
,其 平稳 分 布 为 T(x). 下 面 给 出 产生 此 链 的 Metropolis-Hastings 算法 : 
Step 1: 选择 一 个 不 可 约 Markov 链 转 移 概 率 gq(i,j) ,i,j e S. 再 从 S$S=11， 
2,…,m| 中 选择 某 个 整数 
Step 2: 令 n=0 以 及 X=. 
Step 3: 产 生 一 个 随机 变量 了 使 得 PIX=j 诈 =q(X,)) ,再 产生 一 个 随机 数 


m 


7T(X)q(X,X,) 
HE 

Step 5:ne~n+l1,X,= MH. 

Step 6: 返 回 Step 3. 

由 上 述 性 质 可 以 看 出 ,建议 分 布 g9(x,x') 可 以 取 各 种 形式 . 下 面 我 们 介绍 
一 些 常用 的 建议 分 布 的 选择 方法 . 

( 1 ) Metropolis 选择 


Step 4: 如 果 U < 则 MH = ;否则 MH = X,. 
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选择 对 称 的 建议 分 布 , 即 
q(%,%) 9(% 3%), VX,x € Ss. 
此 时 ,有 





a(x,x’)= min{1 ,| 


T(x) 


例如 , 若 要 产生 一 个 平稳 分 布 为 了 (x) < exp{ - 乞 } 的 Markov 链 ,我 们 可 以 


取 建议 分 布 为 9(z,z') ee exp{ - 号 -} ,再 利用 上 述 算法 即 可 实现 


(站 ) 独 立 抽 样 
如 果 g(x,x') 与 当前 状态 x 无 关 , 即 q(x,x') = q(x'), 则 由 建议 分 布 导出 
的 Metropolis-Hastings 算法 称 为 独立 抽样 . 此 处 a(x,x’) 变 为 
3 w(x') 
a(x,X ) = min{1 i } | 


”w(x) 








W(X = he 
其 中 w(x) = 工人- 


一 般 独 立 抽样 的 效果 可 能 很 好 也 可 能 不 好 ,通常 要 使 独立 抽样 有 好 的 效 
果 , q(x) 要 接近 7(x)，, 比较 安全 的 办 法 是 使 g(x) 的 尾 比 7(x) 重 . 

(证 ) 单 元 素 Metropolis-Hastings 算法 

同时 产生 整个 向 量 X, 有 时 是 很 困难 的 ,而 对 的 分 量 逐 步 进 行 抽样 , 则 
简单 得 多 . 这 就 要 用 到 条 件 分 布 ,特别 是 满 条 件 分 布 . 

考虑 X, | Xi,i = 1,2,…,n 的 条 件 分 布 ,选择 一 个 转移 核 g(x, 一 
x | x.;) 固定 天， = 六 .; =x.; 不 变 ,由 q(x; 一 x;'|x.;) 产生 一 个 可 能 的 x,”， 
然后 以 概率 
T(x') g(x, — x | a 
”T(x) g(x — x' |x.) 
决定 是 否 接 受 x' 作为 链 的 下 一 个 状态 . 这 就 是 单元 素 Metropolis-Hastings 算 
法 . 
| Gibbs 抽样 是 一 种 单元 素 Metropolis-Hastings 算法 , 它 是 在 Metropolis-Has- 
tings 算法 中 取 g(x’ 一 x) 为 T(x;|x.,), 易 知 ,此 时 a(x’ 一 x)=1. 

在 Gibbs 抽样 中 , zx (x; |x._,) 可 能 难以 抽取 ,而 Metropolis-Hastings 算法 有 
很 大 的 灵活 性 , 它 可 取 gq(*,*) 为 易于 抽取 的 分 布 . 在 实际 中 ,我 们 应 将 它们 
结合 起 来 使 用 . 

【 例 8.7】 在 例 8.4 中 ,假设 了 的 观测 数据 如 表 8-2 所 示 . 


ai(xi 一 2 | xi)= min| 


一 一 一 一 一 一 一 一 + 第 8 章 EM 算法 和 MCMC 方法 和 一 一 


表 8-2 观测 数据 
8 345555 13 1827 3 4 人 0 和 A 可- 地 
5 人 46 115147 & 10 8 MI 3 


试 估计 9,A ,k,b,b, 的 后 验 均值 . 

由 于 在 例 8.4 中 已 经 得 到 了 各 参数 9, 和 A ,k,b, ,b, 的 满 条 件 分 布 , 现 从 中 
抽样 得 到 长 度 为 n 的 Markov 链 . Metropolis-Hastings 算法 : 

Step 1: 选 一 个 Markov 链 的 初始 值 (6 ,A" ,hk ,61,62) = (1,1,12,1,1). 

Step 2: 第 i+ 1 步 更 新 ,假设 第 i 步 值 为 (0',A',k,b1,b), 则 利用 Gibbs 
如 下 抽样 : 


好 


六 
1 OA',k' ,bi,b’,Y = Gammal Y,+0.5 ,ir 
"(0 | 1 A 
ki i 
i+l] i+] i i 
和 A ~ 和 (| 8 sk Gamma( DY + 0.5, mr); 
Wt MF 


i+ i i ] 
7T(b 16 绩 扣 1 ;6,7) =16(0: 5 pp 9 


it+1 i+1 i jitl Ee 1 
ba, ru mh ba Os A =16(0.5,— pp) - 
由 于 大 的 满 条 件 分 布 不 是 标准 分 布 ,利用 Metropolis-Hastings 算法 抽取 大”: 
站 (| 
选 建议 分 布 g(K,) = U(2,3,…,m - 1) ,mm 为 了 的 个 数 , 即 q(k,k') = 
则 


We 
去 让 


a(k',k’) = 全 壮 2 的 1| 
mk’ FortlsX bide, EY 
从 (2,3,…,m--1) 中 任意 抽取 一 个 如, 产生 一 个 随机 数 w, 车 u < a(k ,k')， 
则 k! = 妈 ， 否则 ，K"! = 从 ,这 样 就 得 到 第 i+ 1 个 更 新 (0 和", ,bi 
bo 
重复 上 述 步 又 即 可 得 到 此 Markov 链 的 m 个 实现 值 . 其 R 程序 如 下 : 
mhsampler =function( NUMIT= 1000, dat=Y)| 

n = length( dat) 

mchain = matrix( NA, 5, NUMIT) 

kinit = floor( n/2) # approximately halfway between 1 and n 

mchain[ ,1] = c(1,1,kinit,1,1) 
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for (i in 2:NUMIT) 
: 
currtheta = mchain[1,i-1] 
currlambda = mchain[2 ,i-1] 
currk = mchain[3 ,i-1] 
currbl = mchain[4,i-1] 
currb2 = mchain[5 ,i-1] 
## sample from full conditional distribution of theta (Gibbs update) 
currtheta = rgamma(1,shape=sum(Y[1l:currk])+0.5， 
scale = currbl《/(currk * currbl +1)) 
## sample from full conditional distribution of lambda( Gibbs up- 
date ) 
currlambda = rgamma(1,shape=sum(Y[(currk+l):n])+ 
0.5， 
scale =currb2/((n-currk ) * currb2+1)) 
## sample from full conditional distribution of k (Metropolis- 
Hastings update) 
propk = sample(x=seq(2,n-1), size=1) # draw one sam- 
ple at random from uniform(2,..(n-1)) 
## Metropolis accept-reject step (in log scale) 
logMHratio = sum(Y[1:propk]) * log( currtheta) +sum(Y 
[ (propk+1):n])* 
log( currlambda) -propk * currtheta— (n~propk) * currlambda 
=-(sum(Y[1:currk ] ) * log(currtheta)+sum(Y[ (currk+l):n]) * 
log (currlambda ) -currk * currtheta- (n—currk) * currlambda) 
logalpha = min(0 ,logMHratio) # alpha = min(1 ,MHratio) 
if (Yog(runif(1))<logalpha) 
| 
currk = propk 
| 
currk = currk # if we do not sample k (k fixed) 
## sample from full conditional distribution of bl (Gibbs update): 
draw from Inverse Gamma 


currbl = l/rgamma(l1,shape=0.5, scale=1/(currtheta+1)) 
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## sample from full conditional distribution of b2 (Gibbs update ) : 
draw from Inverse Gamma 
currb2 = l/rgamma(1,shape=0.5, scale=1/(currlambda+l1)) 
## update chain with new values 
mchain[ ,i] = c(currtheta, currlambda,currk,currbl ,currb2) 
} 
return ( mchain ) 
} 
运行 apply( hsampler( ) ,1 ,mean) 得 到 9,A,k,b, ,6b, 的 后 验 均值 的 估计 分 别 为 
4.90,8.93,8.53,21031.95, 21935. 82. 


8.3 模拟 退火 


模拟 退火 ( Simulated Annealing, SA ) 法 最 早 由 N. Metropolis 等 人 于 1953 
年 提出 ,但 在 当时 没有 受到 重视 ,直到 1983 年 由 S. Kirkpatrick,C. D. Celatt 和 
M. P. Vecchi 提出 Monte Carlo 模拟 概念 的 随机 搜寻 技巧 ,利用 此 方法 来 求解 
最 优化 问题 时 才 受 到 重视 . 

模拟 退火 来 自 冶金 学 的 专 有 和 名词“ 退火 ”。 退 火 是 将 材料 加 热 后 再 经 特 
定 速率 冷却 ,目的 是 增 大 晶 粒 的 体积 ,并 且 减 少 晶 格 中 的 缺陷 。 材 料 中 的 原子 
原来 会 停留 在 使 内 能 有 局 部 最 小 值 的 位 置 ,加 热 使 能 量变 大 ,原子 会 离开 原来 
位 置 ,而 随机 在 其 他 位 置 中 移动 。 退 火 冷却 时 速度 较 慢 , 使 得 原子 有 较 多 可 能 
可 以 找到 内 能 比 原先 更 低 的 位 置 。 

模拟 退火 的 原理 也 和 金属 退火 的 原理 近似 :我 们 将 热力 学 的 理论 套用 到 
统计 学 上 ,将 搜寻 空间 内 每 一 点 想象 成 空气 内 的 分 子 ;分 子 的 能 量 , 就 是 它 本 
身 的 动能 ;而 搜寻 空间 内 的 每 一 点 ,也 像 空 气 分 子 一 样 带 有 “能 量 ” ,以 表示 该 
点 对 命题 的 合适 程度 。 算 法 先 以 搜寻 空间 内 一 个 任意 点 作 起 始 : 每 一 步 先 选 
择 一 个 “邻居 ”, 然 后 再 计算 从 现 有 位 置 到 达 “ 邻居” 的 概率 。 

令 S$= ss ,ss| ,其 中 s; 为 向 量 ,并 令 V(x) 是 非 负 的 函数 ,x e 5, 假 
设 V(x) 在 S$ 上 至 少 有 一 极 小 值 点 , 即 

V* minV(x) ， 
且 
M=ilreS:Yz)=T |. 

我 们 的 目的 是 求 出 广 , 以 及 在 W 中 的 一 个 元 素 . 为 实现 此 目的 ,我 们 试图 用 
Metropolis-Hastings 算法 . 
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4 统计 模拟 及 其 及 实现 
首先 , 令 温度 参数 7 > 0, 并 考虑 下 述 概率 函数 : 


Pr(Z) = -ay， lL 
ee 
xes5 
令 | M | 表示 M 中 元 素 的 个 数 . 用 er 乘 以 上 式 的 分 子 和 分 母 得 到 
_V(z)-v" 


pr(r) = 一 -一 一 一 一 一 本 下 
| M | + 到 人 了 


xeM 


因为 V(x) -V”> 0, 故 当 7T 一 0 时 ,我 们 有 

1 

plz) TaT po 

0， 若 x # M. 
其 次 ,如果 我 们 令 7 足够 小 ,并 产生 一 个 其 极限 分 布 为 pr(x) 的 Markov 链 , 则 
极限 分 布 的 绝 大 多 数 将 集中 在 M 中 的 点 上 . 如 何 产 生 极 限 分 布 为 pr(x) 的 
Markov 链 呢 ? 先 假设 当前 状态 为 向 量 x e 5, 随机 选择 其 任 一 相 邻 向 量 y es 5 
将 作为 下 一 状态 . 所谓 相 邻 向 量 , 指 两 个 向 量 仅仅 在 一 个 坐标 上 不 同 ,或 者 一 
个 能 够 通过 交换 另 一 个 的 两 个 分 量 而 得 到 . 然后 用 Metropolis-Hastings 算法 ， 
下 一 个 状态 以 如 下 概率 接受 y : 


_v(y) 
e 村 


.| NG)| 
min4 ,Ye 
e 和 





| N(x) | 

否则 ,保持 x 不 变 ,其 中 | N(y) | 是 y 的 “邻居 ”的 个 数 . 
如 果 每 个 向 量 有 相同 的 邻居 数 , 即 使 邻居 数 不 同 ,我 们 也 可 通过 增加 状态 
空间 并 令 新 状态 的 V 值 等 于 0 来 使 其 相同 ,那么 当当 前 状态 是 x 时 ,其 邻居 中 
的 一 个 被 随机 地 选择 到 时 , 若 Y(?) < V(x), 则 此 链 一 定 转移 到 状态 y ; 若 


V(y) > V(x) , 则 此 链 以 概率 exp{ 于 中 二 中} 转移 到 状态 y, 或 者 保持 在 


状态 x 不 变 . 

上 述 算法 的 一 个 弱点 是 因为 7 了 被 选择 得 足够 小 ,如 果 此 链 进 入 到 状态 x， 
它 的 V 值 比 其 邻居 中 的 每 一 个 都 小 ,那么 此 链 进入 到 其 他 状态 可 能 需要 花 很 
长 时 间 . 第 二 个 弱点 是 因为 只 有 有 限 个 x 的 可 能 值 ,整个 收敛 概念 似乎 是 没有 
意义 的 ,因为 在 理论 上 我 们 能 够 计算 每 个 可 能 值 ,所 以 经 过 有 限 步 可 以 得 到 其 
收敛 值 . 因此 ,不 从 严格 的 数学 观点 来 考虑 上 述 方法 ,从 理性 上 把 它 作为 一 个 
启发 式 的 方法 ,这 样 做 发 现 允许 7 的 值 随 着 时 间 的 变化 而 变化 是 有 用 的 . 
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因此 对 上 述 方法 的 改进 就 是 所 谓 的 模拟 退火 算法 : 其 思想 如 下 : 设 T， 
n 志 1 是 一 个 指定 的 其 值 单调 下 降温 度 序列 . 如 果 这 个 Markov 链 的 第 个 状 
态 是 x, 现 随机 地 选择 一 个 其 相 邻 值 y, 则 下 一 个 状态 或 者 以 下 述 概 率 为 y: 


0 
ee 7 


1 LNC) 1 
min4 wa 
e Tn 


TNOx) T 

或 者 停留 在 x. 

基于 数学 上 收敛 性 的 考虑 , 取 了 7， = 其 中 6C>0 是 任何 固定 的 
正常 数 (参见 Besag et al. ,1995 ;Diaconis and Holmes,1995). 如 果 我 们 相继 产 
生 了 m 个 状态 X,,X,，…,X。, 然后 ,我 们 能 够 通过 ,min_V(X,) 来 估计 Y ,又 
如 果 在 了” 上 有 最 小 值 , 这 就 是 在 M 中 的 要 估计 的 点 . 

【 例 8.8】 (旅行 商 问题 ) 假 设 有 m 个 城市 c1;cs,…;c, 以 及 一 个 mxm 
对 称 和 矩阵 也 = (d,) , 其 元 素 d; 表示 城市 i 和 城市 j 的 虐 离 . 又 假设 一 个 商人 居 
住 在 某 个 城市 c; 中 ,他 需要 到 其 他 的 m - 1 个 城市 中 推销 商品 ,然后 返回 家 
乡 . 则 他 应 该 以 何 种 顺序 游历 这 些 城市 ,使 其 路 程 最 短 ? 

令 


A(x)'= dr ,Xi) + d(x ,Xi), 
其 中 x 为 61,c,… ,任意 一 个 排列 . 在 本 例 中 ,x 的 邻居 是 由 互 换 x 中 任意 
两 个 分 量 而 得 到 ,共有 C% = 一 个 邻居 .得 到 Markov 链 的 转移 概率 为 


i 若 x 与 x' 不 为 邻居 ， 


1 


算法 为 
Step 1: 令 处 。 = (ci ,cs，,…,c) 为 初始 状态 . 
Step 2: 设 于 = (x4”,x4”,… ,xM ) 为 第 nn 个 状态 .从 1,2,…,m 任 取 
1,J 且 7 < J, 然后 对 换 站 , 中 的 第 了 和 第 ] 个 分 量 ,得 到 
站 


Step 3: 产 生 一 个 随机 数 4, 若 几 了) < AX,), 则 令 X,,1 = 了 ;否则 ,以 概率 
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1 克 和) -AY) 二 fCX,) -AY) 
exp log(1 +n) ) 使 之， 中 ez log(1 + n) ) 使 


pS 
Step 4: 计 算 min{ (XX,) ,三 十 ,确定 最 优 王 
其 R 程序 为 
exam8. 8 = function(m,D) {#m 为 产生 的 Markov 链 的 长 度 ,D 为 初始 
距离 矩阵 

k=length(D[ ,1]);d=0 

x=matrix(0 ,nrow=m,ncol=k) #Markov 链 的 各 时 刻 的 状态 

a[ Tlek 

for(j in 1:(k-1))| 
d=d+D[j,j+1] 

| 

d[1]=d+D[k,1] 

for(i in 2:m)| 
E=sample(1:k,2) 
I=E[1];J=E[2] 
C=D 
x[i,] =x[i-1,] 
x[i,J]=x[i-1,I] ;x[i,I] =x[i-1,J] 
a=D[ ,1];D[ ,1] =D[ ,J];D[ ,J]=a 
b=D[I,];D[I,]=DLJ,];D[J,]=b 
dl =0 
for(j in 1:(k-1l))|! 

dl=dl+D[j,j+1] 

} 

d[i 计 =dl+Dfk,l] 

if(runif(1)<=min(1,exp( (d[i-1]-d[i])/log(1+i))))| 
x[i,]=x[i,] 

} 

else 


x[i,]=x[i-1,];D=C 
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SEE 


G=0 
for(iin 1:m) | 
if(d[i]==min(d))! 
G=rbind(G,x[i,]);opd=d[i] 
| 
| 
G=G[=1,] 
list( path =x, distance =d ,optimpath = G ,optimdistance = opd ) 


| 
8.4 ”SIR 方法 


假设 随机 向 量具 有 概率 函数 儿 x)= Cifo(x) ,其 中 Ci 为 一 个 正常 数 , 随 
机 向 量 了 具有 概率 函数 g(y) = C,go(y)，, 其 中 C, 为 一 个 正常 数 . 在 筛选 法 中 ， 
若 岂 xz) 和 g(y) 是 确定 的 , 且 g(y) 易 抽样 , 先 从 g(y) 中 产生 向 量 了 , 我 们 可 


We 
选择 常数 C > 0 使 得 二 三 ,以 概率 区 接受 向 量 了 ;否则 重新 开始 . 


这 样 就 可 产生 出 具有 平稳 概率 f(x) 的 样本 . 若 / 和 8 不 是 确定 的 , 则 上 述 筛选 
法 不 可 行 .对 于 此 问题 我 们 需要 SIR(Sampling Importance Resampling ) 算 法 . 
SIR 方法 的 思想 :首先 相继 产生 一 个 其 极限 概率 函数 为 g 的 Markov 链 的 
m 个 状态 , 记 这 些 状态 为 y,… ,y。 然后 定义 “权重 ”wi,i= 1,2,…,m, 如下: 
_ f(yi) 
BC 





并 产生 一 个 随机 向 量 半 使 得 


PI¥X=y,) = ct y t=] ,23m 
2 
当 m 充分 大 时 ,这样 产生 的 随机 向 量 下 近似 地 有 概率 函数 人 
命题 8.1 当 普 一 ,通过 用 SIR 方法 得 到 的 向 量 互 的 分 布 函数 收敛 到 





f 
证 令 了 ,i=1,2,…,m ,表示 由 具有 极限 概率 函数 g 的 Markov 链 产生 


Y, 
的 m 个 随机 向 量 , 令 多, -和 表示 它们 的 权重 . 对 固定 的 向 量 集 4, 令 
ee Y, eA, 
0 ,否则 ， 





L. 
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从 而 
D1m, 
PIXeAlY,i=1,2,…,m|) = 一 一. (8.4.1) 
ZE™, 
根据 Markov 链 的 收敛 性 定理 , 当 m 一 % 时 ,有 
3 ,LW] = E[IWI1= 1]PIT= 1} = E[WIY eA]P,IY e A}, 
- 且 
有 1 _C， 
Ba ts 


因此 ,在 (8.4.1) 中 分 子 分 母 同 时 除 以 m 得 


C 
PIXeAlY.,i=1,2,.…,m| 3 Y e A]P,IY e Al}. 
2 





而 
Cp [WIY eAlPlYeAI=CE [站 | 了 4] 17 e Al 
C, a 本 C2 go( 了 ) 5 
_f f/f) 
= gy)e ty) dy 
= Ho)dy 
从 而 , 当 m 一 % 时 ， 


PIXeAlY,,i=1,2,.…,m| 一 | fly)dy, 
由 Lebesgue 控制 收敛 定理 知 , 上 式 蕴涵 着 3 
PIXeA} =E[PIXeA|Y,,i=1,2,.…,m}] > fdy. 
结果 得 证 . | 
若 要 估计 6 = 忆 [h( 半 ) ] , 而且 用 SIR 方法 已 经 得 到 向 量 下 ,XX,,… ,下 





它们 独立 同 分 布 且 具有 如 下 概率 函数 
RI 定 二 时 | 一 12 
名 ” 
而 二 较 小 , 且 w, = 人. 然后 用 壮 一 作 为 9 的 估计 量 .在 上 述 估计 量 


的 基础 上 ,我 们 对 其 取 条 件 期 望 
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E[h(X) 1 7 yw] = 一 Bh 


Be 


故我 们 再 用 9 = 一 ,) 作为 8 的 估计 量 .根据 6:2 节 中 条 件 期 望 方 


j=1 
2 
i=] 


差 缩减 法 知 , 8 是 比 > 2 更 好 的 一 个 估计 量 . 


SIR 方法 在 Bayes 统计 中 是 特别 有 用 的 . 

【 例 8.9】 用 SIR 算法 在 条 件 驶 放 > 285000 下 产生 1,2,…,100 的 一 
个 置换 | sy i 的 条 件 分 布 . 

设 开 = (XX ,XX,，,… ,wm ) 为 1,2,… ,100 的 某 个 置换 , 令 n=1001, 则 1,2， 


.…,100 的 所 有 的 置换 为 SS 和 | 设 庆 2 | 天 了 天 > 285000 | ， 





则 P[X=4| 马扎 > 285000 | 就 是 所 要 求 的 条 件 分 布 . 易 知 
Piz=xlP| DiX; > 285000 | x=x| 
P{x=sil Bi > 285000 | = 一 -一 一 一， 


?| Biz > 285000 | 
J 


尽管 我 们 知道 P{x=zi Di > 285000 | = 





1 2 
一 pT，* e - 改 , 但 - 履 很 难 确 
定 . 所 以 我 们 要 通过 SIR 方法 对 之 进行 估计 . 令 g(x) = PIX = zl = 55， 
Xe S, f(s) =PIX=alP| D24 > 285000 | X=z| 先 从 g(x) 中 抽取 足够 
多 的 m 个 不 同 的 排列 , 记 为 YY ,YY ,…,Y™, 且 Y= (YY ,… ,YY )， 


二 0() =P| Six > 285000 |X = ,网 
| 


g(Y®) 的 E .人 vw， 
0 ,否则 . 
(i) 
再 令 w= 一 0) ,i=1,2,…,m. 去 掉 w,w,,…,w。 中 为 0 的 项 , 即 为 所 求 
2,0(Y") 
的 条 件 分 布 
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R 程序 如 下 : 
exam8.9=function(m,k=100,a=285000) |# 为 正 整数 
J=1:k; X=matrix(0,nrow=1,ncol=k) 
Y=matrix(0,nrow=m,ncol=k) 
Y[1,]=sample(1:k) 
for(iin 2:m) | 
c=0 
repeat | 
per=sample(1:k) 
for(rin 1:(i-1))! 
clr] =all(per==Y[r,|) 
| 
if(all(c==FALSE)==TRUE ) break 
! 
Y[i,] =per 
| 
for(j in 1:m) | 
if(sum(J* Y[j,])>a)! 
X=rbind( X,Y[j, |]) 
| 
X=X[-1,] 
w=1/(nrow(X)) 
list(n=nrow(X),w=w,X=X) 
} 


练 习 8 


1. 假设 控制 孟 德 尔 试验 中 ,豌豆 颜色 的 位 点 有 两 个 等 位 基因 A 和 a, 又 假 
设 基 因 型 AA 和 Aa 对 应 的 表现 型 为 黄色 ,基因 型 aa 对 应 绿色 。 现 随机 获得 
吏 豆 样本 , 记 黄 色 豌 豆 数 为 nx , 绿色 更 豆 数 为 nm. 根据 数据 nm = 84 和 mo = 
16, 如 何 用 EM 算法 估计 等 位 基因 A 的 概率 p = Pt4} ? 并 编写 程序 计算 . 

2. 利 用 Metropolis-Hastings 算法 及 其 建议 密度 


7 


q(x%,y)=e’”, yy >0， 
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从 折 对 的 正 态 分 布 
f(x) = Sexp- 0.5x’) x>0 
T 
中 抽取 样本 的 程序 . 
3. 考虑 下 述 模型 : 
ps 
其 中 


4 ~ N(0,00), 
oo ~ IGamma(2,1), 
oo” ~ IGamma(2,1), 
在 给 定 样本 y,,y,,…,y, 的 条 件 下 , 试 利用 Gibbs 抽样 法 估计 ,oo”, o ,并 编 
写 程序 . 


4. 考虑 一 个 有 20 个 独立 部 件 的 系统 , 且 部 件 ; 以 概率 0.5 + 二 ,i= 1， 


2,…,20, 工作 . 令 工 表示 工作 的 部 件数 . 用 模拟 来 估计 条 件 概 率 函 数 P{ 工 = 
i|X<5),i=1,2,3,4,5. 
5. 假设 随机 变量 X 和 Y 都 在 (0,10) 上 取 值 . 假设 在 给 定 Y=y 的 条 件 下 
了 了 的 条 件 密度 为 
fl(x|y)=C(y)e™”, 0 <x < 10, 
在 给 定 X=x 的 条 件 下 了 的 条 件 密度 为 
(ylz)=C(x)e，0<y<10. 
给 出 一 种 方法 来 模拟 向 量 世 和 了 并 用 模拟 来 估计 E[X] 及 EL XY]. 
6. 令 ,i=1,2,3, 是 独立 的 具有 均值 为 1 的 指数 随机 变量 .产生 一 个 模 
拟 研究 来 估计 
(1) E[X, + 2X, + 3X, |X, + 2X, + 3X, > 15] ; 
(2) E[X, + 2X, + 3X, | X, + 2X, + 3X, < 1]. 
7. 从 一 个 装 有 n;, i = 1,2,…,r, 种 颜色 卡片 的 卡片 盒 中 随机 地 选择 m 张 


卡片 . 令 = 二 ni. 设 XX 表示 被 取得 的 第 i 种 颜色 的 卡片 数 .车 所 有 的 7 种 颜 


色 的 卡片 都 被 取 到 , 且 所 有 的 颜色 都 被 取 到 的 概率 是 一 个 很 小 的 正 数 , 试 给 出 
一 个 有 效 的 程序 来 模拟 筷 ,X,,… ,XX,. 
38. 假设 X,Y,2 的 联合 密度 为 
A de re x>0,y >0,z >0, 


其 中 a,6,c 是 确定 的 非 负 常 数 , C 不 依赖 于 x,y,z. 试 给 出 模拟 X,Y,Z 的 程 
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序 . 当 a = b=c= 1 时 ,通过 模拟 来 估计 E[XYZ]. 
9. 对 随机 变量 式 ,Y,N, 假设 


PIX=i,y <Y<y+ dy,N=n} 过 co | pe A 
了 


ny 
其 中 i=0,1,…,n,n =0,1,…,y 之 0, a,B,A 是 指定 的 常数 . 当 @& =2,B = 3， 
和 A =4 时 ,通过 模拟 来 估计 ELX],E[Y] 和 EL[LN]. 

10. 产生 100 个 随机 数 Uo ,k=1,2,…,10,U.,,i 关 j,i,j=1,2,…,10. 考 
上 处 一 个 旅行 推销 商 问 题 . 此 推销 商 从 城市 0 出 发 ,按照 1,2,… ,10 的 某 个 排列 
必须 依次 到 10 个 城市 1,2,… ,10 中 的 每 一 个 . 令 U,; 是 此 推销 商 直接 的 从 城 
市 i 到 城市 7 所 得 到 的 报酬 . 用 模拟 退火 法 来 估计 此 推销 商 获得 最 大 可 能 的 回 
报 . 
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第 9 章 、 
若干 动态 系统 的 模拟 


如 果 我 们 计划 建立 某 个 系统 ,就 要 在 事前 对 该 系统 作出 准确 的 评价 ,以 避 
免 不 必 要 的 损失 . 最 好 的 方法 就 是 对 所 要 研究 的 系统 预先 进行 模拟 ,建立 模拟 
模型 ,通过 模拟 模型 对 该 系统 的 某 种 特征 或 部 分 状态 进行 分 析 , 以 得 到 有 用 的 
信息 .为 此 ,本 章 将 介绍 若干 动态 系统 的 模拟 . 


9.1 追逐 问题 的 模拟 


问题 1 在 正方 形 4BCD 的 4 个 顶点 各 有 一 人 . 在 某 一 时 刻 ,4 人 同时 出 
发 并 以 匀速 "走向 顺 时 针 方 向 的 下 一 个 人 . 如 果 他 们 的 方向 始终 保持 对 准 目 
标 , 试 模拟 出 每 个 人 的 路 径 ,并 判断 他 们 是 否 能 够 汇合 . 

为 了 解决 这 个 问题 ,首先 建立 平面 直角 坐标 系 , 以 时 间 间 隔 At 进行 采样 ， 
在 每 一 时 刻 上 计算 每 个 人 在 下 一 时 刻 上 + At 时 的 坐标 . 因为 4 个 人 的 情形 一 
样 ,故我 们 不 妨 设 甲 的 追逐 对 象 是 乙 ,在 时 刻 1, 甲 的 坐标 为 (%i ,Yi), 乙 的 坐 
标 为 (x,,y,)，, 那么 甲 在 时 刻 t+ At 的 坐标 为 (x, + vAtcos9,y, + DAtsing) ,其 
中 


一 Fr 
,ging = ,d= (x x1) + (ys — 71) . 


选取 足够 小 的 At, 模拟 到 甲乙 的 距离 小 于 At 为 止 . 
以 下 是 模拟 的 RR 程序 ,4,B8,C,D 的 4 个 点 的 初始 位 置 为 4(1,0), B(1， 
坟 i OC( 0), D(0,0). 
trace=function( delta_t=0.01,eps=0.01)1| 
## 画 出 A,B,C,D 和 0 五 点 的 初始 位 置 , 并 作 标记 
plot(e(0,1,1,0) ,e(0,0,1,1) ,xlab=" "，ylab="") 
text(0 ,1 ,labels="A" ,adj=c(0.3,1.3)) 
text(1 ,1 ,labels="B" ,adj=c(1.5,0.5)) 
text(1 ,0 ,labels="C" ,adj=c(0.3,-0.8)) 





cosb = 
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text(0 ,0 ,labels="D" ,adj=c(-0.5,0.1)) 

### 和 矩阵 x 是 A,B,C,D,A 五 点 的 横 坐 标 , 矩阵 y 是 A,B,C,D， 
A 五 点 的 纵 坐 标 

x=matrix(c(0,1,1,0,0),nrow=1);y=matrix(c(1,1,0,0,1), 


nrow=1) 
j=0 
repeat{ j=j+1 
d=0; a=0;b=0 


for(i in 1:4)| 
d[i] =sqrt( (x[j,i+1] -x[j,i])2+(y[j,i+1]-y[j,i] )2) 
a[i] =x[j,i]+delta t* (x[j,i+1]-x[j,i] )/d[i] 
b[i] =y[j,i]+delta t* (y[j,i+1]-y[j,i] )/d[i] 
| 
if( max(d) <eps ) break 
a[5]=a[ll];b[5]=b[1] 
x=rbind(x,a) ;y=rbind(y,b) 
| 
lines(x[1:j,1],y[1:j,1],col=5);lines(x[1:j,2],y[1:j,2], 
col=2) 
lines(x[1:j,3],y[1:j,3] ,col=3) ;lines(x[1:j,4],y[1:j,4], 
col=4) 
points Caf] ,b[2] ,col=" yélldw") 
text(a[2] ,b[2] ,labels="0" ,adj=c(-1,0.3)) 
list(x=a[2],y=b[2]) 
| 
运行 程序 trace(0.01,0.02) 得 到 图 9-1, 从 图 中 可 看 出 他 们 能 够 相聚 , 且 聚 于 
点 0(0.5,0.5). 
问题 2 一 列 火车 从 A 站 开 往 B 站 , 某 人 每 天 赶 往 B 站 上 火车 .他 已 了 解 
到 火车 从 A 站 到 B 站 的 运行 时 间 是 服从 均值 为 30 分 钟 、 标 准 差 2 分 钟 的 正 
态 随机 变量 . 火车 大 约 下 午 13 :00 离开 A 站 ,此 人 大 约 13:30 到 达 B 站 . 火车 
离开 A 站 的 时 刻 及 概率 如 表 9-1 所 示 . 此 人 到 达 B 站 的 时 刻 及 概率 如 表 9-2 
所 示 . 问 他 能 赶 上 火车 的 概率 是 多 大 ? 
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0.0 0.2 0.4 0.6 0.8 1.0 
图 9-1 追逐 问题 


表 9-1 火车 离开 A 站 的 时 刻 及 概率 表 9-2 人 到 达 B 站 的 时 刻 及 概率 
火车 离 站 时 刻 | 13:00 13:05 13:10 ”人 到 站 时 刻 |13:28 13:30 13:32 13:34 
概率 0.7 0.2 , .0:1 
















0.3 0.4 0.2 0.1 





设 站 表示 火车 从 A 站 出 发 的 时 刻 , 了 表示 火车 从 A 站 到 B 站 的 运行 时 
” 间 , 2 表示 此 人 到 达 B 站 的 时 刻 . 令 13 时 为 起 始点 , 记 为 0, 则 了 ~ N(30,4)， 
且 半 ,2Z 的 分 布 分 别 如 表 9-3、 表 9-4 所 示 . 


表 9-3 “三 的 分 布 律 表 9-4 Z 的 分 布 律 
时 刻 艺 0 5 10 时 刻 Z 28 30 32 34 
概率 p 0.7 0.2 0.1 概率 0.3 0.4 0.2 0.1 


根据 本 问题 的 含义 知 此 人 能 够 赶 上 火车 的 充分 必要 条 件 是 了 +Y > Z, 其 
概率 为 9=PIX+Y > Z|). 在 计算 此 概率 时 , 既 涉 及 离散 型 随机 变量 又 涉及 连 
续 型 随机 变量 ,难以 用 解析 的 方法 得 到 此 概率 .下面 我 们 通过 模拟 方法 来 估计 
此 概率 0. 

模拟 算法 如 下 : 

Step 1: 从 元 中 抽取 xi ,x,… ,zx, 个 值 ,从 Y 中 抽取 yi,y;，,…,y,,， 从 2Z 
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中 抽取 zi ,za ，… ,zw 


Step 2 : 令 
六 ig i 
0 ,否则 ， 
则 人 = 工科 1 为 g 的 估计 ， 
模拟 程序 如 下 : 
### 给 定 精度 eps=0.01 的 概率 估计 ,pl 为 X 的 概率 向 量 ,p3 为 Z 的 
概率 向 量 


###par 为 正 态 分 布 的 参数 均值 和 标准 差 向 量 
train =function( pl ,par,p3 ,eps=0.01) | 
I=0 
k = 100 
x=sample(c(0,5,10) ,k,prob=pl,replace=TRUE) 
y=rormn(k,par[1],par[2]) 
z=sample(c(28 ,30 ,32 ,34) ,k ,prob =p3 ,replace=TRUE) 
for(iin 1:k)1 
if(x[i]+y[i]>z[i]) I[i]=1 
else I[i]=0 
} 
repeat | 
if(sd(I/k)<eps) break 
k=k+1 
x[k] =sample(c(0,5,10) ,1,prob=pl) 
y[k] =rnorm(1,par[1] ,par[2]) 
z[k] =sample(c(28 ,30,32 ,34) ,1,prob=p3) 
I[k]=if(x[k]+y[k]>z[k]) 1else0 
! 
list(th=mean(I) ,k=k) 
| 
给 出 函数 中 的 参数 为 
pl=c(0.7,0.2,0.1) ;par=c(30,2);p3=c(0.3,0.4,0.2,0.1). 


运行 train( pl ,par,p3 ,0.0001) 得 到 此 人 能 赶 上 火车 的 概率 近似 为 9 ~ 0. 63. 
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9.2 Daubechies 小 波 函数 计算 


小 波 是 近 二 十 年 来 得 到 广泛 注意 的 数学 工具 ,可 以 应 用 于 各 种 数学 分 析 
间 题 . 小 波 中 一 种 重要 的 函数 称 为 尺度 函数 (Scale Function) , 它 满足 所 谓 双 尺 
度 方程 : 


$x) =V2 Yh, $(2x — k). 


一 种 特殊 的 尺度 函数 是 只 在 有 限 区 间 上 非 零 , 称 为 紧 支 集 . 紧 支 集 尺度 函数 可 
以 在 给 定 {1&1 后 用 以 下 迭代 公式 生成 : 
No(%)= Tr os.0.s1C%) ; 


Mar %) =V2 hina (2 六 
其 中 尺 是正 整 数 . N = 2 时, ho。= 0.48296913145,h, =0.836516303738, hh, = 
0. 224143868042, ji =- 0. 129409522551. 已 知 $(x) 的 支 集 为 [0,2N - 1]， 
mi(x) 的 支 集 包含 于 [ - 0.5,2N - 1] 中 .作为 例子 ,下 面 来 编写 计算 g(x) 的 
程序 . 

(1) 因 为 $(x) 是 函数 ,所 以 我 们 只 能 得 到 x 在 g(x) 的 支 集 中 的 一 些 等 
间隔 点 上 的 函数 值 .为 了 用 和 迭代 计算 这 些 值 , 先 写 出 算法 的 R 代码 (基本 结构 
使 用 了 语言 但 某 些 复杂 操作 用 自然 语言 描述 ) : 

aubechie. phi=function( nsample =256 ,nrep=20) | 
需要 计算 的 样本 点 的 个 数 
迭代 次 数 
x= 需 要 计算 的 x 坐标 向 量 
NS2 
h=c(0.48296913145 ,0. 836516303738 ,0. 224143868042 , -0. 129409522551 ) 
y0= 向 量 , 保 存 (x) 在 n=0 时 的 初 值 ， 

当 x 在 [-0.5,0.5] 内 时 为 1, 其 他 为 0 
for(r in nrep) {# 迭代 即 循环 

7= 与 x 长 度 相同 的 零 向 量 
for(k in 1:(2* N-1) ){# 计 算 公 式 中 的 求 和 
yk=m(. ) 在 自 变量 取 2x-k 处 的 值 * sqrt(2) ， 

用 上 一 步 的 y0 来 表达 

y=y+yk 

} # fork 





| # nsample 





# nrep 
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70=y# 把 新 的 m(. ) 放 进 y0 中 

# 作为 下 一 步 的 开始 值 

}# for 

把 x 和 y 只 保留 x 在 [0,2 * N-1] 中 的 部 分 返回 x 和 y 作为 (x[i]， 
h(x[Li])) 
| 

(2) 下 面 逐 步 细 化 这 个 算法 ,并 根据 需要 对 算法 进行 必要 的 修改 . 设 
x[i] =at+(i-1)/(nsample~1) *(b~a) ,我 们 发 现 ,这 个 算法 中 的 关键 问题 是 
如 何 把 2x-k 处 的 函数 值 从 y0 中 查 到 . 理想 的 情况 是 2x[i] -k 恰好 等 于 某 个 
x[j] ,这 时 eta(2. xl[i-k)=eta(xlj]j)=y00j]. 如 果 2xli]-k 在 两 个 x[j] 之 
间 , 可 以 取 最 近 的 一 个 x[j] ,然后 使 用 y0[j]. 经 试验 ,这 样 的 做 法 不 能 保证 迭 
代 收 敛 . 所 以 ,应 该 调整 算法 使 得 每 一 个 2x[i] -k 都 恰好 落 在 某 个 x[j] 上 面 . 
这 要 求 
和 





2a + 2 6- a)=a+! 


其 中 为 采样 点 数 . J 
j=1+2(i 


所 以 只 要 mn-1 能 被 b-a 整除 即 可 .为 此 , 取 a=-1,b=2N-1,n=1+(2N)m,m 
为 整数 .但 是 ,这 样 取 的 n 个 点 包含 了 区 间 [-1,0) ,这 在 最 后 的 结果 中 是 要 于 


弃 的 ,所 以 如 果 采样 至 少 要 nsample 个 点 的 话 ,应 该 保证 《2 一 1) 大 于 或 


等 于 nsample. 
(3) 如 果 必 须要 求 按 指定 的 采样 点 数 给 结果 , 则 可 以 用 线性 插值 来 得 到 
所 需 的 结果 . 线性 插值 的 函数 为 approx(x,y,n) ,其 中 (x,y) 为 要 插值 的 散 点 
(两 个 向 量 ) ,n 是 要 求 的 采样 点 数 (从 * 的 最 小 值 到 最 大 值 均 匀 采 样 ). 
(4) 最 后 的 程序 如 下 : 
### Wavelet.r 
#### Daubechies 迭代 有 限 支 集 正 交 小 波 基 构造 
Daubechies. phi=function( nsample =256 ,nrep =20, plot. it=T, 


Tb -a), 





n-l 
b~-a 


debugging= 下 ,nsample. exact=F) | 
# nsample :采样 点 数 
# plot. it: 是 否 每 次 绘图 
# debugging: 是 否 输出 调试 信息 
#nsample. exact: 是 否 严格 要 求 采 样 点数 
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# 取 FALSE 时 可 以 适当 放大 

# 注意 :所 有 eta(x) 的 支撑 并 集 为 [ -0.5,2N=1]， 

# 但 为 了 和 迭代 时 计算 的 点 都 落 在 采样 点 上 所 以 要 把 左 端点 设 为 -1, 把 采 
样 个 数 适当 放大 

N=2 

a==] 

b=2* N-1 # 采样 区 间 [ -1,2N-1] 
ns=ceiling( (nsample * (2 * N)/(2* N-1)-1)/(2* N)) * (2* N)+1 

# ns: 新 的 采样 点 数 

m= (ns-1)/(2* N) 

# m:phi(x) 的 采样 密度 (x 轴 每 单位 有 和 多少 个 点 ) 
h=c(0.48296913145 ,0. 836516303738 ,0.224143868042， 
-0.129409522551) * sqrt(2) 
x=seq(from=-1,to=2* N-1,length=ns) # x:phi(x) 的 采样 位 置 
y0 =numeric( ns) # 初 始 函 数 
cond1=(x>=-0.5& x<=0.5) 
y0Lcondl ] =1.0 
y0[ 1 condl ] =0.0 
for(r in 1 :nrep) | # 近代 次 数 
if( debugging &&plot. it) | 

plot(x,y0 ,type="l" ,main=paste( " Iteration" ,r) ) 
#locator( n=1) | 
y=numeric(ns) # 迭 代 结 果 
for(k in OQ.(2* N-1))! 

# 首 先 计 算 eta(2 * x-k) ,而 x 对 应 于 a,a+l/m,a+2/m,…,b=at 
(ns-1)/m 共 ns 个 点 ,# 我 们 只 要 找 出 2x -有 对 应 的 下 标 即 可 .这 些 下 
标 里 有 些 是 出 界 的 ,只 要 找 在 1 到 ns 内 即 可 

yk=numeric( ns) # 保存 eta(2 * x-k) 
i=seq(along=x) 
j=2*i-1-(k+l) * m 
cond2=(j>=1)&(j<=ns) 
yk[ cond2] =y0[j[cond2] ] *h[k+l] 
y=y+yk 
| #k 
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y0=y # ”新 的 迭代 初 值 
} #7r 

xphi=x[ (1+m):ns] 

yphi=y[ (1+m) :ns] 

ns= ns 一 m 


# 当 前 phi(x) 从 0 到 2N-1 采 样 的 个 数 , 去 掉 了 [ -1,0) 的 m 个 点 


if( plot. it) | 

plot( xphi, yphi,type="]" ,main= express(phi(x) ) ,xlab="x", 
ylab=s" ") 

abline(h=0) 


| 
这 ( nsample. exact) {# 必 须要 求 nsample 个 点 . 
# 使 用 线性 插值 (approx , approxfun) 
# 使 用 样 条 插值 (spline , splinefun) 


xyl = approx( xphi, yphi,n = nsample) 


xphi= xyl $x 
yphi=xyl $y 


invisible( list( xphi=xphi,yphi= yphi) ) 


| 


0.0 0.5 1.0 1.5 2.0 2.5 3.0 
图 9-2 小 波 采 样 图 
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9.3 排队 系统 


1. 单 服务 员 的 排队 系统 


考虑 顾客 按照 具有 强度 函数 和 (1) ,: > 0 的 非 齐 次 Poisson 过 程 来 到 一 个 
服务 站 ,服务 站 中 只 有 一 个 服务 员 . 当 服 务 员 空 闲 时 , 若 有 顾客 到 来 , 则 立即 接 
受 服务 ;否则 这 个 顾客 就 要 排队 等 候 . 当 这 个 服务 员 完 成 了 对 一 个 顾客 的 服务 
时 ,车 有 顾客 排队 ,就 对 等 待 时 间 最 长 的 顾客 服务 ( 即 先 到 先 服务 ) ; 若 没有 顾 
客 排队 , 则 保持 空闲 直到 下 一 个 顾客 来 到 . 称 一 个 顾客 从 接受 服务 到 结束 服务 
为 一 个 服务 周期 ,在 此 周期 内 ,系统 中 的 顾客 数 称 为 队长 二 一 般 来 说 ,一 个 顾 
客 所 接受 服务 的 时 间 是 一 个 具有 概率 分 布 6 的 随机 变量 , 且 与 其 他 顾客 所 接 
受 的 服务 时 间 相 互 独立 ,也 与 来 到 过 程 相 互 独立 . 在 一 个 服务 周期 了 内 ,此 服 
务 员 只 对 在 时 刻 了 之 前 到 达 的 所 有 顾客 服务 ,在 了 之 后 再 不 允许 顾客 进入 此 
系统 . 

假设 我 们 对 模拟 上 述 系 统 来 决定 如 下 的 量 感 兴趣 : 

(1) 一 个 顾客 花费 在 这 个 系统 中 的 平均 时 间 , 即 排队 时 间 与 接收 服务 时 
间 之 和 ; 

(2) 最 后 离开 的 顾客 超过 时 刻 7 的 平均 时 间 ; 即 这 个 服务 员 能 够 下 班 的 
平均 时 间 . 

为 了 模拟 上 述 系统 ,我 们 引进 以 下 变量 : 

时 间 变 量 i. 

计数 变量 。 NV :到 时 刻 上 时 来 到 的 顾客 数 ; 

No :到 时 刻 上 时 离开 的 顾客 数 . 

系统 状态 变量 SS n :在 时 刻 上 时 系统 中 的 顾客 数 . 

因为 当 一 个 顾客 来 到 或 者 一 个 顾客 离开 时 都 会 改变 以 上 的 量 ,所 以 我 们 
把 它们 看 做 “事件 ”. 也 就 是 ,有 两 个 类 型 的 事件 :来 到 和 离 去 . 事件 清单 包含 
着 下 一 个 顾客 来 到 的 时 间 和 正在 接受 系统 服务 的 顾客 的 离 去 时 间 . 从 而 事件 
清单 为 

EL = 3 ,ts 
其 中 是 在 上 之 后 下 一 个 顾客 来 到 的 时 间 , 如 是 正在 接受 服务 的 顾客 完成 服 
务 的 时 间 . 如 果 没 有 顾客 接受 服务 , 则 令 i, = %. 

输出 变量 为 : 4(i) , 第 i 个 顾客 来 到 的 时 间 ; D(i, 第 i 个 顾客 离 去 的 时 
间 ;7,, 最 后 一 个 顾客 离开 系统 超出 7 的 时 间 . 

假设 服务 时 间 为 Y 服 从 分 布 C, 模拟 步骤 如 下 : 
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Step 1 :初始 步 , 令 上 = N = N, = 0,n = 0, 生 成 元 ,并 令 t = Ti,ijp = %. 

Step 2: 如 果 min{i,ip} 志 7, 转 到 Step 3. 

Step 3: 如 果 志 志 且 二 7, 重 置 i: 二 ,NV 一 和 +1,n+-n+1; 产 生 
7T,, 并 令 4 =7T, ; 若 n=1, 产生 Y, 并 令 1,=t+Y. 收集 数据 4(N)=t (因为 
顾客 N 在 时 刻 :到 达 ) ,返回 Step2. 

Step 4: 否 则 ( 即 i。 <i 且 1, 二 7 ), 重 置 i:= ij,nen-1,N,<*-N,+1; 如 
果 n =0, 令 it, = % ;否则 产生 Y ,并 令 t, =t+Y. 收集 数据 D(N,)=t. 返回 
Step 2. . 

Step 5: 否 则 ( 即 min( 如 ,总 ) > 7 ), 转 到 Step 6. 

Step 6: 如 果 n > 0, 重 置 1=ij,ne 一 n-1,N, 一 N, + 1; 如 果 n > 0, 产 
生 Y, 并 令 t， =t + Y. 收集 数据 D(N,)=i. 返回 Step 5. 

Step 7: 否 则 ( 即 n= 0) ,停止 并 收集 数据 7, = max|t -7,0]. 

注意 :上 述 算法 收集 到 的 数据 N, (整个 到 达 的 总 数 ) ,等 于 No ( 离 去 的 总 
数 ). 对 每 个 i,i = 1,2,…,N,, 我 们 得 到 4(i) (顾客 i 到达 的 时 间 ) 和 D(i) 
(顾客 i 离 去 的 时 间 ) ,从 而 得 到 第 i 个 顾客 花 在 这 个 系统 中 的 时 间 为 D(i) - 
A( 让 . 同时 我 们 还 得 到 7, (最 后 一 个 顾客 离开 系统 超出 7 的 时 间 ). 

每 次 收集 到 上 述 数据 就 称 一 个 模拟 过 程 完成 . 在 每 个 模拟 过 程 完成 之 后 ， 
再 将 之 初始 化 ,直到 收集 到 足够 多 的 数据 为 止 . 我 们 可 以 用 7T, 的 平均 值 来 估 
计 最 后 一 个 顾客 离开 系统 时 超过 7 的 平均 时 间 ;同样 ,用 D - 4 的 平均 值 来 估 
计 一 个 顾客 花 在 系统 中 的 平均 时 间 . 

对 应 的 R 程序 为 (保存 名 为 que. sim. R) 

### 子 程序 TS 表示 用 稀释 法 产生 在 时 刻 s 后 第 一 位 顾客 的 来 到 时 间 
TS=function(lambda,g,s) |#g(t) 为 强度 函数 ,lambda 为 g(t) 的 最 大 值 
t=s;Ts=0 
repeat | 
U=runif(1) 
t=t-1l/lambda * log( U) 
Ul =runif(1) 
if(Ul<=g(t)/lambda) break 


| 
### 在 时 间 T 内 产生 顾客 花费 在 系统 中 的 平均 时 间 及 服务 员 超 时 的 
时 间 
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MG1 =function(TS,T,mu) |# 服 务 时 间 Y 服从 参数 mu 指数 分 布 
t=0;nA=0;nD=0;n=0;A=0;D=0;N=0 
U=runif(1) 
tA=TS(lambda,g,t) ;tD=Inf 
repeat | 

if(tA<=tD & tA<=T)!| 
t=tA;nA=nA+l;n=n+l 
tA=TS(lambda,g,t) 
if(n==1)!| 
U=rmnif(1) 
tD=t=1/mu * log( U) 
| 
A[nA]=t 
| 
else f(tD<=tA & tiD<=T) 1 
t=tD;n=n-l1 
nD=nD+1 
if(n==0) tD=Inf 
else {Ul =runif(1) ;tD=t=1/mu * log( U1)|| 
D[nD]=t 
N[nD]=n 
| 
else if(tA>T&tD>T) break 
repeat| 
if(n<=0)break 
t=tD;n=n-1;nD=nD+l 
D[nD]=t 
N[nD]=n 
if(n>0) | 
U2=runif(1);tD=t-1/mu * log( U2) 
| 
| 
Tp=max(t-T,0) 


229 








统计 模拟 及 其 及 实现 只 





list(w=mean(D-A) ,gohome=Tp,L=mean(N)) 
| 
【 例 9.1】 某 理发 店 只 有 一 名 理发 师 为 顾客 服务 ,按照 先 到 先 服 务 原则 
对 顾客 进行 服务 .假设 该 理发 店 每 天 的 工作 时 间 为 上 午 8 点 到 下 午 8 点 ,在 此 
段 时 间 内 的 顾客 都 必须 提供 服务 ,而 下 午 8 点 后 不 再 接受 新 顾客 . 假设 顾客 是 
以 参数 为 A =1.2 人 /小 时 的 Poisson 过 程 到 达 该 理发 店 , 且 每 位 顾客 的 理发 时 
间 服 从 指数 分 布 ,平均 需要 30 分 钟 . 试 估计 顾客 在 理发 店 的 平均 时 间 、 平 均 队 
长 和 该 理发 师 的 平均 加 班 时 间 . 模拟 100 次 ,再 模拟 1000 ,次 . 
解 ”根据 题 意 , 7 = 12, 和 A =2,/ = 2, 调用 程序 
source( " que. sim. R" ) 
lambda=1.2;g=function(x)1.2;T=12;mu=2 连续 运行 1000 次 
MGI1(TS,T,mu) 
取 平 均 得 到 每 个 顾客 在 理发 店 的 平均 时 间 为 处 = 1.0145 小 时 ,平均 队长 为 
1. 010685 人 ,该 理发 师 的 平均 加 班 时 间 0.721491 小 时 . 如 果 该 理发 师 想 保 证 
按时 下 班 回 家 ,就 要 在 离 下 班 时 间 前 30 分 钟 不 再 接受 新 的 顾客 . 


2. 两 个 服务 员 的 并 联 排队 系统 


考虑 有 两 个 服务 员 的 模型 ,顾客 按照 非 齐 次 的 Poisson 过 程 来 到 . 如 果 两 
个 服务 员 都 是 忙 的 , 则 来 到 的 顾客 将 进入 排队 等 候 的 队伍 中 , 若 服务 员 1 是 空 
闲 的 ,顾客 就 接受 服务 员 1 的 服务 ,否则 就 接受 服务 员 2 的 服务 . 当 顾客 接受 
完 一 个 服务 员 的 服务 (不 管 是 哪个 服务 员 的 服务 ) 后 将 离开 此 系统 . 在 排队 等 
候 的 队伍 中 (如 果 有 顾客 排队 ) 等 待 时 间 最 长 的 顾客 就 接受 服务 . 每 个 顾客 接 
受 服务 员 i 的 服务 时 间 有 分 布 函 数 G6,i = 1,2. 

假设 我 们 要 模拟 上 述 模 型 来 分 析 每 个 顾客 花费 在 这 个 系统 中 的 总 时 间 以 
及 每 个 服务 员 服 务 的 顾客 数 . 因为 有 多 个 服务 员 ,顾客 将 不 必 按 他 们 来 到 的 顺 
序 离开 ,从 而 要 知道 哪 一 个 顾客 将 离开 此 系统 就 要 根据 服务 的 完成 情况 来 确 
定 ,所 以 我 们 必须 了 解 哪些 顾客 在 服务 系统 中 . 当 顾客 到 达 时 我 们 对 之 进行 纺 
号 ,例如 第 一 个 到 达 的 顾客 编号 为 1 ,下 一 个 编号 为 2; 等 等 : 因为 顾客 按 他 们 
的 到 达 次 序 接受 服务 ,从 而 知道 哪个 顾客 正在 接受 服务 以 及 有 多 少 顾客 在 队 
伍 中 等 待 .假设 顾客 i 和 j 正 在 接受 服务 ,其 中 i < j, 有 n - 2 > 0 个 顾客 正在 
排队 . 因为 在 第 j 个 顾客 接受 服务 之 前 有 不 超过 j 的 顾客 数 已 经 接受 了 服务 ， 
因此 没有 一 个 编号 数 超 过 j 的 顾客 接受 完 服务 (因为 他 们 在 顾客 i 或 者 j 之 前 
接受 服务 才能 如 此 ) ,从 而 知 顾客 j + 1,…,j + n - 2 正在 排队 . 

为 了 分 析 此 系统 我 们 引入 下 述 变 量 . 

时 间 变 量 上 
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系统 状态 变量 SS. 
如 果 有 nn 个 顾客 在 系统 中 , 且 第 个 顾客 正在 接受 服务 员 1 的 服务 ,第 i 
个 顾客 正在 接受 服务 员 2 的 服务 时 , 记 SS=(n; 疝 ,如 ). 当 系统 空闲 时 , 记 SS = 
(0); 当 系统 中 只 有 编号 为 的 顾客 并 正在 接受 服务 员 1 的 服务 时 , 记 SS = (1， 
J,0) ;或 者 当 系 统 中 只 有 编号 为 了 的 顾客 并 正在 接受 服务 员 2 的 服务 时 , 记 
6 m/l ,0 7}, 
计数 变量 N4 :到 时 刻 上 时 来 到 的 顾客 数 ， 
Ci :到 时 刻 上 :为止 第 7 了 个 服务 员 已 服务 的 顾客 数 ; 7 = 1 ,2. 
输出 变量 A(n) :第 天 个 顾客 到 达 的 时 刻 ,m 三 1 工 
D(n) :第 个 顾客 离 去 的 时 刻 ,n 宇 1. 
事件 清单 2 
其 中 是 下 一 个 顾客 来 到 的 时 间 , i; 是 正在 接受 服务 员 i 服务 的 顾客 的 
完成 服务 时 间 , i = 1,2. 车 某 时 刻 在 服务 员 i 前 没有 顾客 接受 服务 ,我 们 就 令 
ti = % ,i=1,2. 因此 ,事件 清单 总 是 由 3 个 变量 ,ti,ts 组 成 . 
假设 了 Y 是 具有 分 布 6,，i = 1,2, 的 随机 变量 .模拟 算法 如 下 : 
Siep 1 初始 水; 仿 SECI=CO = 00)pns05 训 守 0B020998 = (nt, 
避让， 迁 二 0, 四 二 0 生成 有， 并 令 日 = 用 三 三 三 西 。 
Step 2: 如 果 t > T 且 1 > T,5 > 了 , 跳 到 Step 6. 
Step 3: 如 果 本 < 轧 且 本 <, 邻 于 NeNiGOND) 一 好 产生 
下 一 个 顾客 的 到 达 时 刻 大 : 
如 果 SS=(0,0;0), 邻 ii =max( 纪 ,i ) +1, 重 置 SS= (1 让 ;0) ,产生 
Y 并 令吉 =t+，; 
如 果 SS= (1,ii,0), 令 记 =max(ii,is) +1, 重 置 SS= (25;i 和 如 ), 产 
生 Y, 并 令 1, = 二; 
如 果 SS=(1;0 疝 局 令 计 =max(ii ,iy) +1; 重 置 SS= (2,ii,is), 产 
生 了 Y 并 令 -t =t + 了; 
如 果 n > 1, 重 置 SS=(nt+1,i ,i,). 
返回 Step 2. 
Step 4: 如 果 t < 有 且 t <b, 令 t=ti, C1-Ci +1,D(i)=t, 
如 果 n=1, 重 置 SS=(0,0,0) 和 ti =%，; 
如 果 n =2, 重 置 SS= (1,0,i) 和 t=%; 
如 果 n > 2, 令 计 =max(ii,i,)+1, 重 置 SS= (n-1,i,is), 生 成 7 
并 令吉 =t+ 了 . 
返回 Step 2. 
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Step 5: 如 果 t, < 有 且 i<h, 令 1=b,C,C;+1,D(i)=1, 
如 果 n=1, 重 置 SS=(0,0,0) 和 t, =%; 
如 果 n=2, 重 置 SS=-(4 计 ,0) 和 三 =%; 
如 果 n >2, 令 =max(ii,i)+1, 重 置 SS= (n-1,i,i,), 生 成 并 
并 令吉 =t+ 了. 
返回 Step 2. 
Step 6: 如 果 SS=(0,0,0) , 转 到 Step 9. 
Step 7: 如 果 SS= (1,ii,0), 重 置 SS=(0,0,0) ,DG ) = ,CC+l. 
如 果 SS= (1,0,i,), 重 置 SS=(0,0,0) ,了 (2) = 已 ，C 一 C + 1. 
如 果 生 < 了， 令 4=6 Ci 二 CI +1)D[D] = 
若 m =2, 则 重 置 SS= (1,0,i); 
车 n> 2, 则 令 纪 =max( 纪 ,is) +1, 重 置 SS= (n--1,i,i,), 产生 了 Y 
并 令吉 =t+. 
如 果 和 三 三 已 ， 令 上 =5C 二 CC +1,D[i,] =1, 
车 n=2, 则 重 置 SS= (1,ii,0) ; 
若 m > 2, 则 令 i =max( 记 ,is)+1, 重 置 SS= (mn-1552), 产 生 也 
并 令 t=t + 了 YY. 
Step 8: 返 回 Step 6. 
Step 9 :输出 数据 清单 4,D,C, ,C;. 
如 果 我 们 根据 上 述 程序 模拟 这 个 系统 ,并 在 预先 确定 的 停止 点 停止 此 模 
拟 , 则 通过 使 用 输出 变量 以 及 计数 变量 Ci ,C, 的 值 ,可 得 到 不 同 的 顾客 来 到 的 
时 刻 和 离 去 时 刻 以 及 每 个 服务 员 服 务 的 总 人 数 等 数据 . 
其 R 程序 如 下 : 
### 产 生 顾 客 到 达 时 间 的 非 齐 次 Poisson 过 程 的 子 程序 
TS=function(lambda,g,s) |#g(t) 为 强度 函数 ,lambda 为 g(t) 的 最 大 值 
t=s 
repeat | 
U=runif(1) 
t=t-l/lambda * log( U) 
Ul=runif(1) 
if(Ul<=g(t)/lambda) break 
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### 并 联 排队 系统 程序 
### 假设 服务 员 1 和 服务 员 2 对 顾客 服务 时 间 服 从 参数 分 别 为 
lambdal ,lambda2 的 指数 分 布 ,T 为 时 间 周 期 
queue2 =function( TS,T,lambdal ,lambda2 ) | 
t=0;nA=0;Cl=0;C2=0;SS=c(0,0.,0) 
DE E00 = y=0 
tA=TS(lambda,g,0) 
repeat | 
if(tAST&tl >T&t2 >T) break 
if(tA<=tl&tA<=t2)| 
t=tA;nA=nA+l;tA=TS(lambda,g,t) 
A[nA]=t 
if(all(SS= =¢6(0,0,0))) [il=max(il;i2)+1 
SS=c(1,il,0);tl=t-1/lambdal * log( runif(1)) 
| 
else if(all(SS==c(1,il ,0))){i2=max(il ,i2)+1 
SS=c(2,il ,i2) 
t2=t-1l/lambda2 * log( runif(1)) 
} 
else if(all(SS==c(1,0,12))){il=max(il ,i2)+1 
SS=c(2,il ;i2) 
tl =t-1l/lambdal * log( runif(1)) 
| 
else if(SS[1]>=2) | 
SS=c(SS[1]+1,il ,i2) 


| 
else if(tl<tA&tl<=t2) | 

t=tl ;Cl=Cl+1;D[il] =t 

if( SS[1] ==1)| SS=e(0,0,0) ;t=Inf) 

else if( SS[1]= =2) | SS=e(1,0,i2) ;tl =Inf | 

else if(SS[1]>2){ il=max(il,i2)+1;SS=c(SS[1]- 
Lil ,12) 

tl =t-1/lambdal * log( runif(1)) 
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| 
else if( (2.<tA&2<tl )| 
t=t ;C2=C2+1;D[i2]=t 
if( SS[1]==1)! SS=c(0,0,0) ;t=Inf | 
这 (SS[1] =,=2){ SS=c(1,il,0;t2 =Inf } 
if(SS[1]>2) | 所 =max(il ,itlsSS=c(SS[1]- 
1,il ,i2) 
t=t-l/lambda2 * log( runif(1)) 


| 
repeat | 
if( all(SS= =e(0,0,0) ) ) break 
else if(all(SS==c(1,il,0))) {Cl=Cl+1;SS=c(0,0,0); 
D[Lil]=tl| 
else if(all(SS==c(1,0,i2))) {C2=C2+1;SS=c(0,0,0); 
D[i2] =t2| 
else if(SS[1]>=2)| 
f(t1<t2)| 
t=tl;Cl=Cl+1;D[il] =t 
if(SS[1]==2)| SS=c(1,0,i2)} 
else if(SS[1]>2)1 il=max(il ,i2)+1;SS= 
c(SS[1]-1,il,i2) 
tl =t-l/lambdal * log( runif(1)) 


} 
else | 
t=12;C2=C241;D[i2] =t 
(SS[ 11.= =2)1. SSe6(1,iD;0) | 
else if(SS[1]>2)| i2=max(il,i2)+1;SS=c(SS[1]- 
1,i1,i2) 
t2=t-l/lambda2 * log( runif( 1)) 
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| 


| 
list( arriv=A,depart=D,C1=Cl;C2=C2) 
| 
【 例 9.2】 假设 某 银行 有 两 个 服务 员 为 顾客 服务 ,服务 周期 为 早上 8:00 
到 晚上 6:00 共 10 小 时 .顾客 按照 参数 为 A = 3 人 /7 小 时 的 齐 次 Poisson 过 程 来 
到 :如 果 两 个 服务 员 都 是 忙 的 ; 则 来 到 的 顾客 将 进入 到 排队 等 候 的 队伍 中 , 若 
服务 员 1 是 空闲 的 ,顾客 就 接受 服务 员 1 的 服务 ,否则 就 接受 服务 员 2 的 服 
务 . 当 顾 客 接受 完 一 个 服务 员 的 服务 后 将 离开 此 银行 ,在 排队 等 候 的 队伍 中 
(如 果 有 顾客 排队 ) 等 待 时 间 最 长 的 顾客 就 接受 服务 . 每 个 顾客 接受 服务 员 i， 
i = 1,2, 服 务 时 间 服 从 速率 分 别 为 4 人 /小 时 与 3 人 /小 时 的 指数 分 布 . 试用 模 
拟 的 方法 求 出 顾客 在 此 系统 中 的 平均 逗留 时 间 及 各 服务 员 平 均 每 天 的 服务 顾 
客 数 . 
据 题 意 ,T=10,lambda=3,g=function(x)3, lambdal =4, lambda2=3, 运 
行 queue2( TS, T,lambdal , lambda2 ) 30 天 得 到 每 个 顾客 的 平均 逗留 时 间 为 
0.31 小 时 ,服务 员 1 平均 每 天 服务 的 顾客 数 为 19. 13 人 ,服务 员 2 平均 每 天 服 
务 的 顾客 数 为 10.17 人 ,银行 30 天 内 大 约 有 17 天 需要 加 班 , 且 平均 加 班 时 间 
为 0.25 小 时 . 据 此 ,银行 在 下 班 前 的 半 小 时 内 谢绝 顾客 来 到 是 合理 的 . 
3. 两 个 服务 员 的 串联 排队 系统 
考虑 一 个 有 两 个 服务 员 的 系统 ,在 这 个 系统 中 ,顾客 按照 非 齐 次 的 Pois- 
son 过 程 来 到 ,每 个 到 达 的 顾客 首先 接受 第 一 个 服务 员 的 服务 ,其 服务 完成 之 
后 再 接受 第 二 个 服务 员 的 服务 . 这样 的 系统 称 为 串联 排队 系统 . 如 果 服 务 员 1 
是 空闲 的 ,来 到 的 顾客 就 接受 服务 员 1 的 服务 ;否则 ,来 到 的 顾客 就 进入 到 等 
候 接受 服务 员 1 服务 的 队伍 中 排队 . 类 似 地 , 当 顾 客 接受 完 服务 员 1 的 服务 
后 ,如 果 服 务 员 2 是 空闲 的 ,此 顾客 就 接受 服务 员 2 的 服务 ;否则 ,此 顾客 就 进 
入 到 等 候 接受 服务 员 2 服务 的 队伍 中 排队 . 在 接受 完 服务 员 2 的 服务 后 此 顾 
客 就 离开 系统 . 假设 每 个 顾客 接受 服务 员 i 的 服务 时 间 有 分 布 函数 6;,i = 1， 
2. 假设 我 们 的 目的 是 研究 一 个 顾客 花 在 系统 中 接受 两 个 服务 员 服 务 的 时 间 
分 布 .我 们 采用 模拟 的 方法 实现 这 个 目的 . 在 模拟 中 我 们 将 用 到 下 述 变 量 . 
时 间 变 量 t. 
系统 状态 变量 SS. (n,n,) :有 个 顾客 在 服务 员 1( 包 括 正在 接受 
服务 的 ) 前 排队 ,有 m 个 顾客 在 服务 员 2( 包 括 正在 接受 服务 的 ) 前 排队 . 
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计数 变量 N4 :到 时 刻 i 时 来 到 的 顾客 数 . 
No :到 时 刻 上 时 离开 的 顾客 数 . 
输出 变量 Ai(n) :顾客 n 到 达 的 时 刻 ,n > 1. 
A,(n) :顾客 n 来 到 服务 员 2 处 的 时 刻 , n 二 1. 
D(n) :顾客 n 离开 的 时 刻 , n = 1. 
事件 清单 [7 
其 中 是 下 一 个 顾客 到 达 的 时 间 , i 是 正在 接受 服务 员 i,i=1,2, 服务 完 
成 的 时 间 . 如 果 在 服务 员 i 处 没有 顾客 接受 服务 ,那么 i = wm ,i = 1,2. 此 事件 
清单 总 是 由 3 个 变量 i ,t ,i 构成 . 
假设 了 ,是 具有 分 布 G6;，i=1,2, 的 随机 变量 , C 为 系统 中 的 顾客 数 mm + 
ns, 模拟 算法 如 下 : 
Step 1 :初始 步 , 令 t=N,=n,=n,=0,N,=0,C=0,4,=0,4,=0,D= 
0, 村 和 工 , 并 令 10.=3T ,i = = wm. 
Step 2: 如 果 t > T 且 t， > 了 ,二 > 7, 跳 到 Step 9. 
Step 3: 如 果 t < 有 且 < , 令 t=6, 和 二 和 +l,n=n +1,A(N,)= 
i, 产生 下 一 个 顾客 的 到 达 时 刻 &. 
如 果 n, = 1, 产生 了 并 令 t =t+ 也 
Step 4: 返 回 Step 2. 
| Step 5;: 如 果 t 二 < 和 且 < ; 令 t=t,n 寺 mm-1,nn,+1,A,(N,-— 
LE 
如 果 n, = 0, 令 4 = %m ;否则 ,如 果 n，> 0, 生成 7 并 令 t = t+ 六 
如 果 n, = 1, 生成 并 令 忆 = + 了. 
Step 6: 返 回 Step 2. 
Step 7: 如 果 < 且 b <t, 令 t= 有 二 Nm +1,n= n, -1,D(N,)= 1t, 
如 果 n, = 0, 重 置 = % ;否则 ,如 果 n。> 0, 生成 六 并 令 1, = t+ 
Step 8: 返 回 -Step2: 
Step 9: 如 果 n, =0 且 mw =0, 停止 并 转 到 Step 18. 
Step 10: 如 果 n，> 0 或 mw > 0, 转 人 Step 11. 
Step 11: 如 果 和 三 <, 则 伎 f= 二 n 一 1,nn,+1,A,(N, -ni)= 
t. 转 到 Step 12. 
Step 12: 如 果 n, =0, 今 i =%m ;如 果 n，> 0, 生 成 了 并 令 t =t+ YY. 
Step 13 :如 果 m = 1, 生成 Y 并 令 1, =t + 了 了. 
Step 14 :返回 到 Step 9. 
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”Step 15: 如 果 ti 三 已 , 则 令 关 = ,石生 让 =-1 二 Ni+1l, 转 到 Step 16. 
Step 16: 如 果 m = 0, 重 置 i, = om ;否则 ;生成 二 并 令 1, =t + 了, 记 
D(N) = C= 4 n,. 
Step 17: 返 回 Step 9. 
Step 18 :输出 变量 4, ,4,,D,C. 
其 R 程序 为 
queue3 = function ( TS, T, lambdal, lambda2 ) | ## # TS 
为 产生 顾客 来 到 的 时 刻 函 数 
t=0;nA=0;nl=0;n2=0;nD=0;C=0 
DOA -0,A2=0 ,i eoit 
tA=TS(lambda,g,0) 
repeat | 
if(tA>T & tl1>T & t2>T) break 
else if(tA==min(tA ,tl ,12))| 
t=tA;nA=nA+l;nl =nl+l 
tA=TS(lambda,g,t) 
if(nl==1) {tl=t-l/lambdal * log( runif(1)) | 
A Tt 
} else if(t1 ==min(tA,tl,t2))| 
t=tl;nl =nl -1;n2=n2+1 
站 (和 1 = 一 0 济 圾 状 ! 洲 } 
else if(nl >0)1 
t] =t-l/lambdal * log( runif(1)) 
| 
if(n2==1)t2=t-1l/lambda2 * log( runif(1)) 
’ A2[nA-nl ] =t 
| else if(12==min(tA,tl,t2))| 
t=t2;nD=nD+l1;n2=n2-1 
i(n2==0)1{ =Inf | 
else if(n2>0) |t2=t-1l/lambda2 * log( runif(1))| 
D[nD]=t;C[nD]=nl+n2 


| 


repeat| 
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if(nl==0&n2==0) break 
else if(nl>0 || n2>0) | 
f(t1<t2) | 
t=tl ;nl =nl -1;n2=n2+1 
a 
else if( nl1>0) | 
tl =t-1l/lambdal * log( runif(1)) 
} 
if(n2==1) {|=t-l/lambda2 * log( runif(1))} 
A2[nA-nl ] =t 
} else| 
t=t2;nD=nD+l1;n2=n2-1 
if(n2==0)| t=Inf} 
else if(n2>0) {t=t-l/lambda2 * log(runif(1))} 
DLnD]=t;C[nD] =nl+n2 


| 
list(A1=Al,A2=A2,D=D,barC=mean(C)) 
} 
【 例 9.3】 考虑 有 甲乙 两 台 机 器 的 加 工厂 ,需要 加 工 的 产品 先 在 甲 机 器 
上 加 工 后 ,再 转 到 乙 机 器 上 加 工 ,然后 出 厂 . 该 加 工厂 每 天 早上 8:00 开始 上 
班 ,晚上 6:00 下 班 .两 台 机 器 分 别 加 工 一 个 产品 的 时 间 服 从 指数 分 布 ,机 器 甲 
平均 每 小 时 加 工 10 个 产品 ,而 机 器 乙 平 均 每 小 时 加 工 12 个 产品 .假设 要 加 工 


的 产品 以 强度 函数 A(!)=6 + 一 4_,t > 0, 非 齐 次 的 Poisson 过 程 来 到 . 试用 模 


t+l1’ 
拟 方法 估计 平均 每 件 产品 花费 在 工厂 的 时 间 . 

令 g=function (x)6+4/(x+1);T= 10; lambda = 10; lambdal = 10; 
lambda2 = 12 ,运行 queue3 (TS ,T,lambdal ,lambda2) 30 天 得 到 平均 每 件 产品 
花费 在 工厂 的 时 间 为 0.48 小 时 . 

4. 模拟 模型 的 验证 

我 们 希望 用 离散 事件 方法 来 模拟 的 最 终结 果 是 由 无 误 的 计算 机 程序 产生 
的 .为 了 证 实 这 个 程序 中 没有 缺陷 ,我 们 应 该 运用 标准 的 调试 计算 机 程序 的 技 
术 . 有 几 个 技术 是 特别 适合 调试 模拟 模型 的 ,现在 我 们 对 之 进行 讨论 . 
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对 于 大 的 程序 ,应 该 设法 对 子 块 或 者 子 程序 来 逐步 调试 . 也 就 是 ,我 们 应 
该 设法 把 这 个 程序 分 割 成 一 些小 的 或 者 是 易于 处 理 的 程序 .例如 ,在 模拟 模型 
时 ,随机 变量 的 产生 就 构成 一 个 模块 ,对 这 些 模块 应 该 单独 进行 验证 . 

统计 模拟 通常 是 用 大 量 的 输入 变量 写 出 . 通常 选择 一 个 合适 的 值 能 够 简 
化 这 个 模拟 模型 成 为 一 个 能 够 进行 评估 的 或 者 是 已 经 被 广泛 研究 过 的 模型 ， 
以 使 模拟 的 结果 能 和 已 知 的 答案 进行 比较 . 

在 测试 阶段 ,程序 输出 结果 应 该 是 它 产 生 的 所 有 随机 量 的 值 : 通过 适当 地 
选择 简单 而 又 特殊 的 情形 ,我 们 能 把 模拟 产生 的 结果 与 手工 得 到 的 答案 相 比 
较 . 例 如 ,假设 我 们 模拟 单个 服务 员 的 排队 系统 . 以 例 9. 1 为 例 来 验证 程序 是 
否 正确 ,为 了 便于 手工 验算 ,输入 7 =6, 假设 模拟 程序 产生 了 以 下 数据 : 


顾客 : 1 2 3 4 5 6 3 
到 达 时 间 : (0 be Rh ,ey ES. le 
服务 时 间 : 0.19 0.88 0.17 0.12 0.47 0.35 0.61 


又 假设 此 程序 根据 这 7 个 顾客 产生 的 输出 为 花费 在 这 个 系统 中 的 平均 时 
间 是 0.32. 

根据 手工 的 计算 ,我 们 看 到 第 一 个 顾客 在 时 刻 0: 14 来 到 并 花 了 0. 19 个 
时 间 单 位 在 这 个 系统 中 ,第 二 个 顾客 在 时 刻 2. 58 来 到 并 在 时 刻 2. 58 接受 服 
务 ,花费 了 0. 88 个 时 间 单 位 ;第 三 个 顾客 在 时 刻 2.79 来 到 并 在 时 刻 3. 46 接 
受 服务 ( 当 第 二 个 顾客 离开 时 ) ,并 花 了 0.17 个 时 间 单 位 ,因此 第 三 个 顾客 花 
了 0. 84 个 时 间 单 位 在 系统 中 ;等 等 . 将 此 计算 表述 如 下 : 


顾客 : 1 项 3 4 5 6 可 

到 达 时 间 : 0.14 2.58 2.79 4.37 4.84 5.24 5.86 
服务 开始 的 时 刻 : 0.14 2.58 3.46 4.37 4.84 5.31 5.86 
离 去 时 刻 : 0.33 3.46 3.63 4.49 5.31 5.66 6.47 


在 系统 中 的 时 间 : 0.19 0.88 0.84 0.12 0.47 0.42 0.61 


因此 根据 7 = 6 之 前 到 达 的 顾客 花 在 系统 中 的 平均 时 间 的 输出 结果 为 


0.19 + 0.88 + 0.84 + 0.12 +0.47 + 0.42 +0.61 
7 


因此 这 证 明了 计算 机 程序 输出 的 结果 0.32 是 有 误差 的 . 

在 检索 计算 机 程序 的 错误 时 ,一 个 有 用 的 技术 是 进行 跟踪 . 在 跟踪 中 , 状 
态 变 量 、 事 件 清单 以 及 计数 变量 在 每 个 事件 发 生 后 都 被 打印 出 来 , 据 此 就 可 确 
定 何 时 程序 出 错 . 如 果 跟 踪 时 没有 发 现 错误 出 现 ,我 们 就 再 检查 与 输出 变量 有 
关 的 计算 .以 下 几 节 模型 都 可 以 采取 类 似 的 方法 进行 验证 。 


= 0. 50. 
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9.4 存储 模型 


考虑 一 个 备 有 某 种 商品 的 商店 ,其 销售 价格 为 每 单位 元 . 假设 需求 此 种 
商品 的 顾客 数 服 从 参数 为 的 Poisson 分 布 ,每 个 顾客 的 需求 量 是 一 个 分 布 函 
数 为 C 的 随机 变量 . 为 满足 顾客 的 需求 ,店主 必须 储存 一 定量 的 此 种 商品 ,而 
且 不 论 何 时 商品 的 库存 不 足 时 ,那么 此 商品 就 会 从 发 货 商 处 得 到 补充 ,这 个 店 
主 用 所 谓 (*,$) 的 订货 方针 , 即 只 要 商店 的 存货 少 于 *(* < 5 ) , 且 当 前 没有 
订货 , 则 将 库存 量 补充 到 5， 即 ,如 果 当 前 的 库存 水 平 是 «而 又 没有 订货 , 且 x 
< s, 那么 就 订购 S -x 个 单位 的 该 种 商品 . 设 订购 此 种 商品 y 个 单位 的 成 本 函 
数 为 ce(y) ,而且 需要 二 个 时 间 单 位 才能 交付 订单 ,其 报酬 依赖 于 订单 的 交付 . 
男 外 ,商店 在 单位 时 间 内 每 库存 一 个 单位 的 商品 需要 花费 h 个 单位 的 费用 . 进 
一 步 假 定 一 个 顾客 需求 的 商品 量 超过 了 此 商店 的 现 有 库存 量 ,那么 商店 将 现 
有 的 所 有 的 商品 卖 完 ,其 不 足 部 分 就 造成 了 商店 的 损失 . 

在 某 个 固定 时 间 7 内, 如何 用 模拟 的 方法 来 估计 商店 的 期 望 利润 ? 为 达 
到 此 目的 ,我 们 首先 定义 如 下 的 变量 和 事件 . 

时 间 变 量 t. 

系统 状态 变量 SS (x,y) : * 是 当前 商品 的 库存 量 , y 是 此 商品 订货 量 . 

计数 变量 C :到 时 刻 1 时 订单 花费 的 总 和 . 

H :到 时 刻 i 商品 库存 的 总 花费 . 
R :到 时 刻 i 获得 的 收入 总 量 . 
事件 将 由 一 个 顾客 或 者 是 一 个 订单 的 来 到 组 成 . 事件 的 时 间 是 
to: 下 一 个 顾客 到 达 的 时 间 . 
ti :已 签 的 订单 交付 的 时 间 . 如 果 没 有 预 签 的 订单 ,那么 我 们 取 
tI| = %. 

通过 比较 事件 发 生 的 时 间 i。 和 的 大 小 来 完成 此 更 新 . 用 上 表示 当前 时 

刻 ,并 由 上 述 变 量 ,我们 能 够 进行 如 下 的 更 新 . 


情形 1; 加 < 与. 
重 置 :有 He 二 有 + (to -1)xh, 因为 在 时 刻 t 和 i 之 间 , 对 每 单位 的 存货 ,我 们 
需要 花费 (t。- t)h 的 费用 . 
再 令 :t =. 


产生 一 个 具有 分 布 6 的 随机 变量 D, D 是 在 i 时刻 来 到 的 顾客 的 需 
求 量 . 
令 w = min(D,x) 为 顾客 能 够 买 到 的 商品 量 . 在 卖 出 w 个 商品 量 后 ， 
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则 存储 量 为 x - w. 

再 令 :R=R + wr. 

再 令 :x =x -ww 

如 果 x < ss 且 y =0, 则 再 令 y=5S = 六 =t + 了 


产生 U, 并 令吉 = - log( U). 


情形 2: i < … 
再 令 : He H+ (tl -i)xh. 
再 令 : t= 
再 令 : CoC+e(y). 
再 令 :x 二 x+y 
再 令 :y=0, = om. 


通过 运用 上 述 更 新 时 刻 表 ,我们 容易 写 一 个 模拟 程序 来 分 析 此 模型 .然后 
运行 这 个 程序 直到 在 某 个 预先 指定 的 时 间 7 之 后 第 一 个 事件 发 生 为 止 ,我 们 
再 用 一 二 = 作为 这 个 商店 的 每 单位 时 间 的 平均 利润 的 估计 量 . 改变 和 5 
的 值 再 重复 上 述 程序 ,将 能 使 我 们 为 此 商店 确定 一 个 合适 的 库存 量 . 存 贮 问题 
的 RR 程序 为 
inventory =function( x,T,lambda,s,S,h,r;L,d,lose,a;b) | 
###x 为 当前 的 存货 ,T 为 时 间 周 期 ,lambda 为 顾客 来 到 速率 
###(s,S) 为 库存 策略 
挫 #h 为 单位 时 间 单 位 商品 的 库存 费 
挫 #r 为 商品 的 零售 价 
捧 #L 为 订货 的 周期 
###d 为 订货 费用 函数 (包括 运输 费用 ) 
###lose 为 损失 函数 
###a 为 需求 量 ,b 为 对 应 的 分 布 律 
t=0;U=ronif(1);i:0=-1/lambda * log(U) 
tl=Inf;H=0;C=0;R=0;y=-0 
loss=0;k=1 
while( tO[k]<=T)| 
k=k+l 
it(t0[k-1]<tlLk=-1])| 
H=H+(t0[k-1]-t) * h(x) ;t=t0[k-1] 
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D=sample(a,1,prob=b) 
w=min(D,x) 
if(D>x) { loss[ k-1]=lose(D,x) } 
else| loss[k-1]=0 | 
R=R+w *r;x=x—w 
if(x<s & y= =0)| 
y=S-x;tl[k]=t+L 
| 
U=ranif(1);t0[k]=t-l/lambda * log(U)ilose[k]=0 
| else | 
H=H+(tl[k-1]-t) *x*h;t=tl[k-1] 
C=C+d(y) ;x=x+y 
y=0;tl[k]=Inf;loss[k]=0 
| 
| 
(R-H-C-sum( loss) )/T 
| 
【 例 9.4】 设 某 商店 经 销 某 种 商品 ,每 天 来 此 商店 购买 此 种 商品 的 顾客 
按照 速率 为 8 的 Poisson 过 程 来 到 ,而 且 据 历史 经 验 得 到 顾客 的 购买 量 的 分 
布 律 如 表 9-5 所 示 . ” 
此 种 商品 单价 为 5 元 ,每 
表 9-5 ”购买 量 & 的 分 布 律 天 库存 此 种 商品 一 单位 的 费用 
é 1 2 3 4 为 0.5 元 ,运费 为 10 元 ,而 卖 
p 0.7 ”0.2 0.08 ”0.02 出 此 种 商品 一 个 单位 的 价格 为 
12 元 . 若 商店 的 库存 量 小 于 顾 
客 的 需求 量 , 也 会 带 来 损失 
(该 赚 的 而 没有 赚 到 看 做 一 种 损失 ) , 设 损 失 函 数 lose(D,x)=(D=x) .2,x < 
D. 如 果 店 主 的 存 贮 策略 为 (s,S) = (10,120). 问 在 一 个 月 内 ,此 商店 是 否 盈 
利 ? 利润 是 多 少 ? 
根据 题 意 , lambda = 8, T=30,r=12, 成 本 函数 d(x) = 10 + 0.5x, 库存 
晴 数 h(x) = 0. 5x. 运行 inventory(x,T,lambda,s,S,h,r,L,d,lose,a,p) 得 到 平 
均 每 天 利润 为 68. 84 元 . 若 要 得 到 最 佳 策略 ,可 通过 不 断 调整 (s ,5S) 的 值 进行 
寻找 . 如 何 寻 找 最 佳 策 略 (s,S) 留 作 练习 . 
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9.5 保险 风险 模型 


假设 某 意外 保险 公司 需要 索赔 的 客户 数 是 速率 为 A 的 Poisson 过 程 , 且 每 
个 客户 的 索赔 额 是 具有 分 布下 的 随机 变量 .假设 新 客户 以 速率 v 的 Poisson 过 
程 来 签订 合同 , 且 原 来 的 客户 继续 与 公司 保持 合同 的 时 间 是 一 个 速率 的 指 
数 随机 变量 . 再 假设 每 个 客户 固定 地 在 每 单位 时 间 付 给 保险 公司 c 个 单位 的 
费用 .保险 公司 开始 有 m 个 客户 ;有 本 金 ou 宇 0,; 我 们 的 目的 是 用 模拟 来 估计 
直到 时 刻 7 为 止 保险 公司 的 资金 总 是 非 负 的 概率 . 

为 了 便于 进行 模拟 ,定义 如 下 变量 和 事件 : 

时 间 变 量 

系统 状态 变量 (n,a) : n 为 此 公司 的 客户 数 , a 为 此 公司 的 当前 资金 . 

事件 ” 有 3 种 类 型 的 事件 ,新 增 一 个 客户 .失去 一 个 客户 以 及 一 个 索赔 . 

事件 清单 仅 有 一 个 值 , 即 下 一 个 事件 发 生 的 时 间 . 


EL ES 
首先 注意 下 述 事 实 : 
若 随 机 变量 X， ~ E(A),i=1,2,…,n,Y ~ E(4), 且 它们 相互 独立 , 则 


A 
nA 十 内 

根据 上 述 事实 ,我 们 能 得 到 下 一 个 事件 发 生 的 时 间 所 构成 的 事件 清单 . 如 
果 (n,a) 是 在 时 刻 上 时 的 系统 状态 ,那么 下 一 个 事件 发 生 的 时 间 将 等 于 :+ 艺 ， 
这 里 是 一 个 具有 速率 v + ny + nA 的 指数 随机 变量 . 下 一 个 事件 的 发 生 ,以 


概率 一 -一 一 新 增 一 个 新 的 客户 ,或 者 以 概率 一 一 此 一- 失去 一 个 客 


vtnu+nA vt+nu+nA 


户 , 或 者 以 概率 一 一 一 一 -进行 一 个 索赔 : 


vt+nu+nA 
设 索赔 额 了 是 具有 分 布下 的 随机 变量 .又 设 J = 1 表示 新 增 一 个 新 的 客 
户 , 设 J = 2 表示 失去 一 个 客户 , 设 J = 3 表示 一 个 索赔 . 其 分 布 律 如 表 9-6. 


min(X ,X,Y) ~ El(na +1u), BPIX,= min(X,Y)} = 


表 9-6 事件 类 型 的 分 布 






3 












nA 
vt+nu+nA 
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输出 变量 / 
如 果 公司 的 当前 资金 在 区 间 [0,:] 上 非 负 ， 
0， 否则 . 
下 面 给 出 模拟 算法 : 


Step 1 :初始 化 , 令 t1=0,a = ao,n = no,1=0, 然后 产生 闭 并 令 it = 久 . 

Step 2: 如 果 is > 7, 令 1= 1 并 中 止 , 转 到 Step7. 

Step 3 :否则 ,再 令 o 二 at+nc(i -1), 且 t=ts: 产生 一 个 了 

Step 4: 如 果 J=1, 令 nn+1,; 产生 XX, 再 令 忆 =t+ 于 ,返回 Step 2. 

Step 5: 如 果 J=2, 邻 nn 一 1, 产生 匀 , 再 令 t 寺 =t + 了 ,返回 Step 2. 

Step 6: 如 果 J=3, 产生 Y. 车 Y> a, 令 1=0 并 中 止 , 转 到 Step 7; 否则 令 
a =a -了 ,产生 XX, 再 令 ts =1 + 辣 , 返回 Step 2. 


Step 7: 记 录 ts 的 值 并 计算 min( 呈 ,1] 
其 R 程序 为 


insuran = function(T,nu ,mu,lambda ,n0 ,a0,c,lambdal ) | 
k=1;J=0;t=0;n=n0;a=a0+n * c;tE=rexp(1,nut+n* mu+n* 
lambda) 
repeat {k=k+l 
if(tE[k-1]>T) break 
else| 
t=tE[k-1] 
q=nu+n * mu+n * lambda 
p=c(nu/q,n* mu/q,l~nu/q-n * mu/q) 
J[k-1]=sample(1:3,1,prob=p) 
if(J[k-1]==1) {n=n+l;alk] =a[lk-1]+c} 
else if(J[k-1]==2) |n=n-l;a[k]=a[lk-1]-c* 
(T=t)/T| 
else if(J[k-1]==3)| 
Y=rexp(1,lambdal ) 
if(Y>al k-1 |])break 
else |a[k]=a[k-1l]-Y| 
| 
tE[k]=t-l/(nutn * mutn * lambda) * log( runif(1)) 
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} 

list(rewp=min(tE[k-1]/T,1) ,a=a[lk-1],tE=tE,J=table(J)) 

#list(rewp=min(tE[k-1]/T,1) ,a=a[ k-1]) 

| 

【 例 9.5】 设 保险 公司 拥有 启动 资金 2;5 万 元 ;已 有 客户 100 人 ,每 人 预 

交 1200 元 , 按 一 年 时 间 进 行 投保 :如 果 出 现 意 外 事故 ,保险 公司 按 均值 为 2 万 
元 的 指数 分 布 付 给 客户 保险 费 . 每 个 客户 在 一 年 内 以 速率 '0.5 人 次 退 保 ,公司 
按 投保 时 间 的 比例 退 给 此 客户 预 交 金 . 而 在 一 年 内 以 速率 50 人 次 新 增 一 位 客 
户 . 试用 模拟 估计 保险 公司 破产 率 以 及 年 终 的 盈利 . 


根据 题 意 知 , 7 = 365, nu = 字 ， mu -5 ， lambda = 一， 于 -二 -加 ay 三 





25000, c = 1200, lambdal = 运行 insuran(T,nu,mu,lambda,n0 ,a0,c, 


2 
20000- 
lambdal ) 100 次 得 到 保险 公司 破产 率 为 0.05, 年 终 的 盈利 为 .83825.46 - 
25000 = 58825. 46 元 . 


9.6 维修 问题 


一 个 系统 需要 n 台 机 器 同时 工作 才能 运行 . 为 防 机 器 出 故障 ,有 备用 的 机 
器 * 台 . 只 要 有 一 台 机 器 出 故障 ,立即 用 一 台 备用 机 器 替换 ,并 将 故障 机 器 送 
维修 车 间 进 行 修理 ,而 维修 车 间 只 有 一 个 修理 工 , 且 每 次 只 能 修一 台 机 器 . 一 
且 出 故障 的 机 器 被 修好 后 就 成 为 备用 的 机 器 . 每 台 机 器 的 修理 时 间 是 相互 独 
立 的 且 具 有 共同 分 布 C 的 随机 变量 . 当 一 台 机 器 投入 使 用 时 ,那么 它 在 出 故 
障 之 前 的 运转 时 间 和 过 去 的 运转 时 间 以 及 修理 时 间 独 立 并 服从 分 布 的 随 
机 变量 . 

当 一 台 机 器 损坏 而 没有 备用 的 机 器 可 用 时 , 则 称 这 个 系统 “ 瘫 痰 ”. 我 们 
感 兴趣 的 是 模拟 这 个 系统 运转 时 间 T. 

时 间 变 量 L. 

系统 状态 变量 r :在 时 刻 t 出 故障 的 机 器 数 . 

因为 当 一 台 正 在 工作 的 机 器 出 故障 或 者 当 一 台 机 器 维修 完成 时 ,这 个 系 
统 变量 将 发 生变 化 ,所 以 只 要 一 台 正 在 工作 的 机 器 出 故障 或 者 一 台 机 器 维修 
完成 ,我 们 就 说 一 个 “事件 ”发生 . 为 了 知道 下 一 事件 何 时 发 生 ,我 们 需要 跟踪 
目前 正在 使 用 的 机 器 出 现 故 障 的 时 间 和 目前 正在 修理 的 机 器 被 修好 的 时 间 
(车 有 机 器 在 修理 ). 因为 我 们 总 是 需要 确定 这 n 台 机 器 出 故障 时 间 的 最 小 
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值 ,所 以 将 n 台 机 器 出 故障 的 时 间 按 次 序 进行 排列 是 方便 的 ,从 而 令 事件 的 清 
单 如 下 : 
事件 清单 :ti 二 和 二 志和 

其 中 ,4 ,ts,… ,是 目前 在 使 用 中 的 n 台 机 器 损坏 的 时 间 , 1:” 是 目前 在 维修 
的 机 器 被 修好 的 时 间 , 如 果 目 前 没有 机 器 要 维修 ,就 令 1” = %. 

为 了 模拟 此 过 程 ,我 们 把 这 些 变 量 进行 初始 化 : 

Src0, t=%, 

产生 相互 独立 的 具有 分 布下 的 随机 变量 X, ,X,,… , 世 . 

将 这 些 值 进行 排序 并 令 it, 是 第 i 个 最 小 值 , i = 1,2,…,n. 

令 事件 清单 : 4 ,t,，… ,t,t . 


按照 下 述 两 种 情形 更 新 这 个 系统 . 
情形 1: i <i. 
再 令 ;t =. 


再 令 : rr + 1( 因 为 另外 一 台 机 器 已 经 出 现 故 障 ) 
若 * =。 + 1, 停止 运行 并 收集 数据 7=+( 因 为 目前 有 s+ 1 台 机 器 出 
现 玫 障 ,没有 备用 机 器 可 用 ). 
车 r < s + 1, 产生 具有 分 布 亚 的 随机 变量 X, 这 个 随机 变量 表示 现在 
开始 投入 使 用 的 备用 机 器 的 工作 时 间 . 再 将 4 ,4，… ,t,t + X 的 值 排序 ,并 令 
4 为 这 些 值 中 的 第 ;个 最 小 值 ,i = 1,2,…,n 
车 "=1, 产生 具有 分 布 5 的 随机 变量 了 , 并 令 1”=++Y (这 是 必要 的 , 因 
为 在 这 种 情形 下 刚 出 故障 的 机 器 是 此 时 唯一 出 故障 的 机 器 ,并 立即 对 此 机 器 
进行 维修 ;了 是 它 的 维修 时 间 ,因此 它 在 ! + 了 时 被 修好 ) 
情形 2: :1* <. 
再 令 : t=t". 
再 令 : r 一 r - 1. 
车 + > 0, 产生 具有 分 布 6 的 随机 变量 了 
再 令 所 =t+Y. 
若 r = 0， 就 令 忆 = 
每 当 停止 (在 *=s + 1 时 事件 发 生 ) 时 ,我 们 就 说 一 个 过 程 被 完成 . 这 个 过 
程 的 输出 结果 是 这 个 系统 竣 普 时刻 7 的 值 . 然后 重新 初始 化 并 模拟 另 一 个 过 
程 . 总之, 我们 进行 次 这 样 的 过 程 得 到 输出 的 结果 为 7,7,,…,7,。 因 为 这 
个 随机 变量 是 相互 独立 的 ,每 次 代表 了 此 系统 的 出 现 竣 羔 时 间 , 其 平均 值 
站 于是 ELT7] 的 估计 值 , E[ 7] 表示 系统 的 平均 竣 痪 前 运转 时 间 ， 





表示 机 器 的 修理 时 间 ， 
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实施 上 述 算法 的 R 程序 为 
repair=function(n,s,lambdal ,lambda2 ) | 
t=r=k=0;trep= Inf 
tin=rexp(n,lambdal ) 
tin=sort( tin) 
repeat| k=k+l 
if(tin[1] = =Inf) break 
else if(tin [1]<trep[k]y)| 
t=tin[1];r[k]=r[k]+l;r[k+1]=r[k] 
x=rexp(1,lambdal ) ;tin[1] =t+x 
tin = sort( tin) 
if(r[k]==1) | 
y=rexp(1,lambda2) ;itrep[k] =t+y 
trep[k+1] =trep[ k] 
} 
else if(r[k]>1 & r[k]<=s) {trep[ k+1]=trep[ k]) 
else if(r[k]>=s+1) break 
| else! 
t=trep;r[k] =r[ k]-1 
y=rexp(1,lambda2); trep[k] =t+y 
if(r[k]==0) ftrep[k+l]=Inf| 
else if(r[k]>0)1{ trep[ k+1] =trep[ k]} 


| 
list( T=t,tin=tin ,trep=trep,r=r) 
【 例 9.6】 有 一 个 系统 ,需要 15 个 部 件 同 时 工作 才能 运行 ,而 且 准 备 了 5 
个 备用 部 件 ,每 个 部 件 的 工作 寿命 都 服从 均值 为 0.01 小 时 的 指数 分 布 . 若 部 
件 损坏 立即 送 往 维 修 点 修理 ,修理 时 间 服 从 均值 为 0.1 小 时 的 指数 分 布 ,部 件 
修好 后 和 新 部 件 具 有 同样 的 作用 并 立即 送 往 系统 进行 备用 . 如 果 系 统 中 所 有 
的 部 件 损坏 而 又 没有 备用 部 件 时 , 则 系统 瘫痪 . 请 模拟 出 系统 在 瘫痪 前 的 运转 
时 间 了 
据 题 意 知 , A, = 0.01, A, =0.1,n=15,s=5, 运行 repair(n,s,lambdal， 
lambda2 ) 10000 次 得 到 平均 系统 竣 痰 前 运转 时 间 为 118. 98 小 时 . 
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9.7 ”期权 实施 策略 


设 5,,n > 0, 为 某 种 股票 在 第 ”天 的 收盘 价格 , 设 妃 ,X,… ,X, 是 相互 独 
立 的 具有 均值 和 方差 o? 的 正 态 随机 变量 , Xx, 表示 第 i 天 相对 于 第 i- 1 天 的 
增长 率 .一 个 常用 的 模型 是 

: S$, = Soexp|X, + X, 十 二 天 二， n> 0. 

此 模型 称 为 对 数 正 态 随机 游 动 模型 . 通过 计算 可 得 第 n 天 的 收盘 价格 5, 的 期 
望 值 


E[S,] = s, TI ELe”] = 0 





其 中 a = 此 + 全 ,假设 有 一 个 在 接 下 来 的 NN 天 内 以 固定 价格 ( 遍 定 价 ) 购 买 


此 股票 一 单位 的 优先 权 ,如 果 能 够 立刻 转手 以 价格 $ 卖 出 此 股票 ,那么 我 们 称 
S - 玉 为 利润 .在 拥有 期 权时 间 内 ,如果 股 票 价格 高 于 敲定 价 玉 , 就 实施 期 权 ; 
否则 ,不 实施 期 权 ,我 们 称 此 规则 为 期 权 实施 的 策略 . 从 而 知 ,拥有 期 权 所 获得 
的 期 望 利润 依赖 于 对 期 权 实 施 的 策略 . 能够 证 明 ,如 果 a = 0, 则 最 优 策略 是 
直到 股票 价格 超过 天 时 就 实施 期 权 ,否则 不 实施 . 因为 X， +X + … + X 是 一 
个 均值 We 和 方差 No” 的 正 态 随机 变量 ,所 以 很 容易 确切 地 计算 出 按照 这 个 
策略 得 到 的 回报 .然而 , 当 a < 0 时 ,很 难 找到 最 优 的 或 者 一 个 接近 最 优 的 策 
略 ,而 且 对 任何 一 个 合理 的 策略 都 不 可 能 确切 地 计算 所 期 望 的 盈利 .我 们 现在 
给 出 一 个 当 a < 0 时 能 够 实施 的 策略 . 尽管 这 个 策略 离 最 优 策略 还 很 路 远 , 但 
它 是 合理 的 . 此 策略 是 :假设 离 期 权 到 期 还 有 m 天 ,车 此 后 第 i,i= 1,2,…,m， 
天 的 价格 大 于 等 于 天 , 就 实施 此 期 权 , 否 则 放弃 实施 此 期 权 . 
令 P, = 5,_， 表示 在 期 权 还 有 m 天 到 期 时 的 股票 价格 .那么 我 们 建议 的 策 
了 略 如 下 : 
如 果 离 期 权 到 期 还 有 mm 天, 则 当 了 ;> 天 时 ;于 对 于 每 个 zz= 1 这 六 mm 有 
P, > K+P,e"@(o/i +b,) - K®(b,), 
i 一 og 


其 中 G(x) 是 标准 正 态 分 布 函 数 , 则 在 这 个 时 期 实施 期 权 . 
Oi 


如 果 期 权 实 施 了 ,就 令 SP 表示 期 权 执行 时 股票 的 价格 ;如 果 期 权 没 有 实 
施 ,就 令 SP = 有 为 了 得 到 上 述 策 略 的 期 望 值 ,也 就 是 为 了 确定 ELSP] -天 , 在 
理论 上 很 难处 理 ,必须 采取 模拟 的 方法 . 对 于 给 定 的 参数 ,0o,N,K,5。, 策略 
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的 模拟 步骤 为 
Step 1 :产生 WV —m 个 具有 均值 凤 和 标准 差 oO 的 正 态 随机 变量 | he: > 


N-m 


Xm; 令 P, = Sn = Se 
Step 2: 产 生 一 个 具有 均值 u 和 标准 差 o 的 正 态 随机 变量 工 , 由 P。，= 
P。e 来 产生 NN - mm 后 每 天 的 股票 价格 P。, ,P。: ，…, 己 . 
Step 3: 若 P, >, 且 对 于 每 个 i=1,2,…,m, 有 P > K+P,e"@$(ofi+t 
b;) - KB(b;), 则 在 离 到 期 日 m 天 实施 此 期 权 , 令 SP = P, 并 记录 之 . 
Step 4: 如 果 m 不 满足 Step 3 , 则 对 m - 1 重复 Step 3. 
Step 5: 如 果 没 有 m 满足 Step 3 , 则 令 SP = 并 记录 之 . 
其 R 程序 为 : 
######### 井 ## 收 盘 价 ########## 间 埋 #### 
EndPric = function( x,P) {| al=mutsigma’/2 
K+P x* exp(x* al) * pnorm(sigma * sqrt(x)+(x* mu-log( K/ 
P))/(sigma * sqrt(x) ) ) 
—K * pnorm( (x* mu-log( K/P))/(sigma * sqrt(x) ) ) 
| 
拭 相 形 # 埋 持 #### 实 施 期 权 程 序 夫 掉 看 看 掉 大 ## 
stock =function( SO0 ,K ,N ,muysigma) | 
P=S0;m=N 
repeat| i=1:m 
if(P>K & all(P_EndPric(i,P) >0) ) break 
X=rnorm(1,mu,sigma) ;P=P * exp(X) 
m=m-l 


if(m<=0) break 


{if(m<=0)SP=K else SP=P} 
list(SP=SP,m=m) 
| 
stock(S0 ,KK ,N ,mu,sigma) 
【 例 9.7】 如 果 目 前 的 股票 价格 是 150 元 ,此 期 权 可 以 在 接 下 来 的 30 天 
内 任何 时 候 以 价格 为 150 元 购买 此 股票 . 假设 在 本 节 的 模型 中 ,上 =- 0. 09， 


0 =0.4, 并 应 用 本 节 所 提出 的 策略 来 实施 期 权 . 试 根 据 模拟 来 估计 拥有 一 个 
期 权 的 平均 值 . 


249 





统计 模拟 及 其 及 实现 只 





据 题 意 知 , S, =150, K=150, N=30, =-0.09,o =0.4, 运 行 stock(S0， 
K,N ,mu,sigma)1000 次 得 到 此 期 权 的 平均 值 为 235.5246 元 . 


练 习 9 


1. 一 只 兔子 在 0 点 处 , 它 的 洞穴 在 正 北 20 米 的 B 处 ,一 只 狼 位 于 兔子 的 
正 东 33 米 的 4 处 .模拟 如 下 追逐 问题 : 狼 以 一 售 于 兔子 的 速度 紧 有 盯 着 兔子 追 
击 。 画 出 狼 追 逐 免 子 的 追逐 曲线 . 问 : 当 兔子 到 达 洞 口 前 是 否 被 狼 逮 住 ? 

2. 某 维修 中 心 在 周末 只 安排 一 名 员工 为 顾客 提供 服务 . 新 来 维修 的 顾客 
到 达 后 , 若 已 有 顾客 正在 接受 服务 , 则 需要 排队 等 候 . 假设 来 维修 的 顾客 到 达 
过 程 为 Poisson 过 程 ,平均 4 人 /小 时 ,维修 时 间 服 从 指数 分 布 ,平均 需要 6 分 
钟 . 试用 模拟 的 方法 求 该 系统 的 平均 队长 ,以 及 每 位 顾客 花费 在 系统 中 的 平均 
时 间 和 员工 平均 加 班 时 间 . 

3. 一 个 服务 员 的 售 货 亭 ,顾客 的 平均 到 达 时 间 ( 单 位 为 : 秒 ) 服 从 正 态 分 
布 W(20,10'`) , 顾客 购买 商品 量 的 分 布 律 为 


下 1 2 3 4 
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购买 每 件 商品 需要 的 时 间 ( 单 位 为 : 秒 ) 服 从 正 态 分 布 N(15 ,5 ). 若 售 货 亭 无 
顾客 , 则 新 到 的 顾客 接受 服务 ,否则 排队 等 候 . 试 模拟 售 货 亭 运营 12 小 时 后 ， 
售 货 亭 的 平均 队长 、 顾 客 的 平均 花费 时 间 及 售货员 的 平均 加 班 时 间 . 

4. 在 单 服务 员 的 排队 模型 中 ,来 到 过 程 是 一 个 具有 速率 10 的 Poisson 过 
程 ,服务 时 间 服 从 区 间 (0.5,1.5) 上 的 均匀 分 布 ,时 间 周 期 为 7 = 9. 试 估计 一 
个 顾客 花费 在 系统 中 的 平均 时 间 、 平 均 队长 以 及 服务 员 平 均 加 班 时 间 . 

5. 设 打印 室 有 2 名 打字 员 ,每 个 文件 打印 的 时 间 服 从 指数 分 布 ,打字 员 1 
和 打字 员 2 打印 一 份 文件 的 平均 时 间 分 别 为 10 分 钟 和 12 分 钟 ,而 文件 的 到 
达 是 以 速率 为 15 件 / 小 时 的 Poisson 过 程 :试用 模拟 的 方法 求 出 打印 室 打 印 一 
份 文件 的 平均 时 间 及 各 打字 员 平 均 每 小 时 打印 的 文件 数 . 

6. 在 有 2 个 服务 员 的 排队 模型 中 ,假设 每 个 服务 员 前 有 其 自己 的 排队 ,一 
个 来 到 者 加 入 到 最 短 的 队伍 中 . 当 来 到 者 发 现 两 个 队伍 一 样 长 (或 者 发 现 两 
个 服务 员 前 都 是 空 ) 时 就 来 到 服务 员 1 前 . 

(1) 确 定 适当 的 变量 和 事件 来 分 析 这 个 模型 ,并 给 出 更 新 过 程 . 

(2) 假 设 服 务 员 1 的 分 布 是 速率 为 4 的 指数 分 布 ,服务 员 2 的 分 布 是 速率 
为 3 的 指数 分 布 ,并 且 顾 客 以 速率 为 6 的 Poisson 过 程 来 到 . 
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试 求 1000 个 顾客 花费 在 系统 中 的 平均 时 间 及 这 1000 个 来 到 者 中 由 服务 
员 1 服务 所 占 的 比例 . 

7. 假设 某 地 区 某 品牌 的 代理 商 销售 该 品牌 的 产品 ,购买 此 产品 的 顾客 按 
照 速率 为 50 人 /天 的 Poisson 过 程 来 到 该 代理 处 ,而 且 据 以 往 的 经 验 ,顾客 的 
购买 量 X 的 分 布 律 如 下 : 

下 1 2 S 4 
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此 代理 商 从 厂家 进货 的 单价 为 500 元 ,每 天 库存 此 种 商品 一 单位 的 费用 为 0.5 
元 ,每 次 从 厂家 进货 的 运费 为 100 元 ,而 卖 出 此 种 商品 单价 为 950 元 . 车 代理 
商 的 库存 量 小 于 顾客 的 需求 量 , 也 会 带 来 损失 (该 赚 的 而 没有 赚 到 视 为 一 种 
损失 ) , 设 损失 函数 
lose(D,x)=(D-x) .50,x < 也 . 

如 果 该 代理 商 的 存 贮 策略 为 (s,S) = (10,100). 

试 求 :(1) 在 一 个 月 内 ,此 代理 商 平均 的 利润 是 多 少 ? 

(2) 如 何 改变 策略 (s,S) 使 得 利润 达到 最 大 ? 

8. 假设 一 个 保险 公司 每 天 的 索赔 客户 数 服从 速率 为 10 起 /天 的 Poisson 
过 程 . 每 个 客户 的 索赔 额 是 一 个 均值 为 1000 元 的 指数 随机 变量 . 假设 该 公司 
以 固定 速率 11000 元 /天 收 到 付款 且 启动 资金 为 2500 元 . 试用 模拟 来 估计 该 
公司 的 资金 在 前 365 天 中 始终 为 正 的 概率 . 

9. 假设 一 个 系统 由 4 台 机 器 组 成 ,其 中 备用 机 器 为 3 台 , 每 台 机 器 的 寿命 
分 布 函 数 为 

F(x)=1-e™. 

若 机 器 损坏 立即 送 修理 厂 维修 ,每 台 机 器 维修 时 间 的 分 布 函 数 为 C(x) = 1 - 
e-*. 请 模拟 估计 此 系统 瘫痪 的 平均 时 间 . 

10. 在 维修 模型 中 ,假设 修理 车 间 有 2 个 修理 工 ,每 个 工人 修理 机 器 的 时 
间 是 具有 分 布 G 的 随机 变量 . 为 此 系统 画 一 个 流程 图 . 

11. 如 果 当 前 某 股票 的 收盘 价 为 36.31 元 , 现 有 一 个 期 权 可 以 在 接 下 来 的 
30 天 内 任何 时 候 以 价格 为 36.31 元 购买 此 股票 .假设 此 股票 价格 模型 为 对 数 
正 态 随机 游 动 模型 ,其 相对 于 前 一 天 的 增长 率 服从 正 态 分 布 N( - 0. 05， 
0.16) , 并 应 用 9.7 节 所 提出 的 策略 来 实施 期 权 . 试 根据 模拟 来 估计 拥有 此 期 
权 的 平均 价值 . 
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